31日,教育部發布《關于加強數字中文建設 推進語言文字信息化發展的意見》,明確我國已建成世界最大的規模語言資源庫和中國語言資源知識圖譜,集成120多種語言和方言資源。今年,全國語言文字使用情況調查將首次實施。
教育部語言文字信息管理司司長劉培俊介紹,我國已發布100多項國家通用語言文字和民族語言文字信息化規范標準,為自然語言處理技術在人工智能、數字產品和信息產業領域的應用創新奠定規范基礎;高水平開展普通話水平測試,實現了測試方式從人工到智能的轉變。我國還建成了集成化、智能化、國際化的全球中文學習平臺,用戶超1600萬人,覆蓋190多個國家和地區。
今年,全國語言文字使用情況調查將首次實施,打造集數據采集、傳輸、存儲、加工一體的集成化調查平臺,為深化教育綜合改革和綜合國力分析提供大數據支撐。我國還將創新應用自然語言處理、多模態信息處理、知識圖譜等5項前沿技術,夯實國家關鍵語料基礎設施建設。
為加快推進語言文字信息化,《意見》提出,將數字中文建設作為服務數字中國建設的重要任務和全面推進語言文字信息化發展的突出重點,著力推進中文數字化與數據中文化,完善新型中文服務體系構建與語言文字治理體系。
到2027年,我國將基本形成“政府主導、部門協同、社會參與、共建共享”的語言文字信息化工作機制,國家語言文字大數據中心基本建成,初步建成國家關鍵語料庫和國家戰略語言資源信息庫,前沿語言技術、優質語言資源、新型語言服務等基礎支撐能力顯著增強。到2035年,中文在全球數字空間、網絡空間以及生成式人工智能等關鍵應用場景中的使用占比將顯著提高,語言文字信息化整體水平位居世界前列。
版權所有:中華人民共和國教育部 中文域名:教育部.政務
京ICP備10028400號-1 京公網安備11010202007625號 網站標識碼:bm05000001