2024 年 11 月 14 日,“大模型与语言资源学术研讨会暨粤语语料库建设与大模型评测重点实验室启动会” 在广州大学(黄埔校区)举行。该重点实验室由广州大学和广州市社会科学界联合会联合共建。其相关情况如下:
- 研究方向:
- 粤语文化精神标识体系研究:深入探究粤语文化的核心精神、独特标识,为粤语文化的精准定位和深度理解提供理论支持,以便更好地在大模型应用中体现粤语文化的特色。
- 通用粤语语料库建设:收集、整理、标注大量的粤语语料,建立起全面、准确、通用的粤语语料库,为大模型的训练和优化提供基础数据支持。
- 大模型粤语言语交互质量评测:制定科学的评测标准和方法,对大模型在粤语语言交互方面的质量进行评估,包括语言理解的准确性、语言生成的自然度、语义表达的完整性等方面。
- 大模型粤语言语交互质量提升研究:基于评测结果,研究如何改进大模型的算法和技术,提高其在粤语语言交互方面的质量和效果,以满足用户的需求。
- 运行机制与合作模式:
- 运行机制:采取 “1+1+n” 的运行机制,即由广州大学和广州市社会科学界联合会联合共建,同时联合广东、香港、澳门的学术团体以及互联网企业等多方面力量共同参与。
- 合作模式:采取政产学研用一体化的模式,形成围绕粤语语料库建设与智能化服务的合作生态。以广州大学为主体,依托学校的网络空间安全学院、人文学院、新闻与传播学院等多个学院的学科优势和专业资源,打造跨学科协同创新科研平台。
- 重要意义:
- 文化传承方面:粤语作为中华文化的瑰宝,承载着粤港澳大湾区深厚的历史文化底蕴。该实验室的成立有助于推动粤语文化的数字化传承,保护和传承这一宝贵的文化遗产。
- 学术研究方面:为多学科交叉融合创新研究提供了平台,探索具有中国特色、岭南风格的城市文化传承、保护与发展之路,将成为广州大学跨学科发展中的重要学术平台。
- 区域发展方面:能在粤港澳大湾区乃至全球的文化交流与合作中发挥积极作用,对于推动大湾区的文化融合和发展具有重要意义。
- 专家团队:设立 “双首席科学家”。由中国工程院院士、广州大学网络空间安全学院名誉院长方滨兴,香港科技大学(广州)党委书记、国家语委科研机构国家语言服务与粤港澳大湾区语言研究中心主任屈哨兵教授分别担任重点实验室技术首席专家与语言首席专家,承担学术指导和咨询工作,保障重点实验室学术发展方向。
该实验室第一期建设周期为五年,长远目标是成为立足粤港澳大湾区、面向国家语言服务战略、通用粤语语料库及大模型粤语服务评测的国内乃至全球首屈一指的科研与对外服务专业学术性机构。 |