關(guān)于征集2025年AI+多語種翻譯方向儲(chǔ)備課題的通知
為貫徹落實(shí)《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案(2023-2025年)》《北京市科技賦能文化領(lǐng)域創(chuàng)新發(fā)展行動(dòng)計(jì)劃(2025-2027年)》,加快推動(dòng)我市人工智能賦能多語種翻譯創(chuàng)新發(fā)展,現(xiàn)面向在京創(chuàng)新主體,圍繞AI+多語種翻譯方向,征集2025年儲(chǔ)備課題。
一、征集方向
(一)語音翻譯方向
1.研究內(nèi)容
針對當(dāng)前基于端到端翻譯的多語種語音翻譯大模型在多語種場景下存在的覆蓋語種有限、翻譯精度不足、實(shí)時(shí)翻譯效率低等問題,通過研發(fā)多語種端到端語音翻譯大模型技術(shù)及應(yīng)用,融合語音到文本的跨模態(tài)端到端翻譯、流式意群切分和信息重組、流式語音合成以及系統(tǒng)級的自動(dòng)調(diào)度等關(guān)鍵技術(shù),建立基于端到端翻譯的多語種語音翻譯模型及應(yīng)用,打造面向國際會(huì)議會(huì)展、企業(yè)出海、電視直播、多語種教學(xué)等領(lǐng)域的多語種語音翻譯解決方案,推動(dòng)多語種語音翻譯技術(shù)的實(shí)用化和產(chǎn)業(yè)化,提升我國在多語種語音處理領(lǐng)域的技術(shù)水平和國際競爭力。
2.考核指標(biāo)
(1)研發(fā)多語種端到端語音翻譯大模型,支持以中文、英語為核心,面向法語、俄語、西班牙語、阿拉伯語等聯(lián)合國官方語言,以及不少于10個(gè)非通用語種的語音輸入、實(shí)時(shí)翻譯及目標(biāo)語言文本輸出和語音播報(bào),實(shí)現(xiàn)端到端的多語種語音翻譯功能。
(2)在安靜環(huán)境(信噪比≥30dB)下,聚焦近場演講場景,單人演講、上課場景達(dá)到可用,多語種端到端大模型翻譯準(zhǔn)確度不低于4.4分(以下均為5分制),內(nèi)容完整度不低于4.4分,整體MOS評分不低于4.0分,其中中英方向不低于4.2分;端到端翻譯的多語種語音翻譯系統(tǒng)平均首響時(shí)間≤3s。
(3)構(gòu)建多語種語音翻譯行業(yè)應(yīng)用場景庫不少于3類,包括但不限于國際會(huì)議、會(huì)展演講、電視直播等場景,系統(tǒng)應(yīng)具備歷史信息記憶機(jī)制和基于語音的信息檢索增強(qiáng)能力,高效融合術(shù)語庫和禁用語庫。
3.項(xiàng)目交付成果
多語種語音翻譯系統(tǒng)解決方案1套,集成多語種端到端語音翻譯大模型、相關(guān)硬件設(shè)備。
(二)文檔翻譯方向
1.需求目標(biāo)
針對用戶在多格式文檔(如Word、Excel、PPT、PDF、圖片等)翻譯中面臨的格式解析困難、版式還原度低、專業(yè)領(lǐng)域翻譯準(zhǔn)確性不足、高并發(fā)場景下效率低等問題,構(gòu)建端到端文檔翻譯大模型。實(shí)現(xiàn)從文檔解析到譯文生成的端到端處理,提升多格式文檔翻譯效率、版式還原度及垂類領(lǐng)域?qū)I(yè)性,滿足跨語種文件、科研文檔、法務(wù)合同、技術(shù)支持等場景的高精度翻譯需求。
2.考核指標(biāo)
(1)研發(fā)基于端到端交互的多語種文檔翻譯大模型
支持以中、英為核心,面向法語、西班牙語、阿拉伯語、俄語等聯(lián)合國官方語言,以及不少于40種非通用語種的文檔結(jié)構(gòu)解析、實(shí)時(shí)翻譯及目標(biāo)語言的文檔原版式輸出(保留原文檔中段落、插圖位置類版式信息,以及句子級別的字號、字體、顏色等版式信息、公式信息等),實(shí)現(xiàn)從原始文檔(如 Word、PDF、圖片等)到終稿譯文的端到端處理,減少中間環(huán)節(jié)損耗。
(2)文檔格式支持
覆蓋Word(doc/docx)、Excel(xls/xlsx)、PPT(ppt/pptx)、PDF(含掃描件)、TXT、圖片(jpg/jpeg/png/bmp)等不少于13種格式。
解析成功率≥98%。
(3)譯文保留原文檔版式信息
段落結(jié)構(gòu)還原度≥99%。
圖片/表格位置還原度≥98%。
公式/特殊符號還原度≥95%。
字體/字號/顏色還原度≥96%。
(4)翻譯質(zhì)量與性能(5分制)
翻譯準(zhǔn)確性評分≥4.4分。
內(nèi)容完整度評分≥4.4分。
語言流暢度評分≥4.2分。
(5)術(shù)語庫干預(yù)效果
指定術(shù)語庫匹配準(zhǔn)確率≥99%。
專業(yè)術(shù)語翻譯一致性≥98%(覆蓋科技、政治、法律等領(lǐng)域?qū)傩g(shù)語)。
(6)單文檔翻譯速度
純文本文檔類≥2頁/秒。
圖文混合類≥1.5頁/秒。
圖片類≥1.5張/秒。
(7)穩(wěn)定性
系統(tǒng)連續(xù)穩(wěn)定運(yùn)行≥99.9%。
歷史任務(wù)存儲(chǔ)與檢索響應(yīng)時(shí)間≤2秒。
術(shù)語庫調(diào)用響應(yīng)時(shí)間≤1秒。
(8)應(yīng)用場景
構(gòu)建多語種文檔翻譯行業(yè)應(yīng)用場景庫不少于3類,包括但不限于會(huì)議演講稿、科研論文等場景,系統(tǒng)應(yīng)具備歷史信息記憶機(jī)制和基于信息檢索增強(qiáng)能力,高效融合術(shù)語庫和禁用語庫。
(三)項(xiàng)目交付成果
多語種文檔翻譯系統(tǒng)解決方案1套,集成基于端到端交互的多語種文檔翻譯大模型。
二、評審方式
方向一:課題面向本市相關(guān)領(lǐng)域優(yōu)勢創(chuàng)新主體開展征集,征集結(jié)束后將于10個(gè)工作日內(nèi)組織創(chuàng)新主體,面向會(huì)議同傳場景,以現(xiàn)有AI翻譯產(chǎn)品“賽馬”,經(jīng)專家評估,評選優(yōu)勝團(tuán)隊(duì)開展課題支持,并在“智領(lǐng)未來”北京人工智能品牌系列活動(dòng)中全面推廣使用。
方向二:課題面向本市相關(guān)領(lǐng)域優(yōu)勢創(chuàng)新主體開展征集,征集結(jié)束后采用專家評審的形式對申報(bào)課題開展評審工作。
三、申報(bào)課題、申報(bào)單位及申報(bào)負(fù)責(zé)人要求
(一)申報(bào)課題
申報(bào)課題應(yīng)具有較為明確的技術(shù)路線,具有清晰、可量化的目標(biāo)及考核指標(biāo)。每個(gè)方向擬支持課題1項(xiàng),申請課題實(shí)施周期原則上不超過1年。
(二)申報(bào)單位
1.申報(bào)單位須為在北京地區(qū)注冊、具有獨(dú)立法人資格的單位。具有相應(yīng)的科研能力和條件,具備健全的項(xiàng)目(課題)管理、財(cái)務(wù)管理、科研人員管理、科技成果與知識(shí)產(chǎn)權(quán)管理、檔案與保密管理等制度,擁有專業(yè)研究團(tuán)隊(duì)和科研管理團(tuán)隊(duì),運(yùn)行管理規(guī)范。
2.申報(bào)單位需符合《北京市科技計(jì)劃項(xiàng)目(課題)管理辦法》和《北京市科技計(jì)劃管理相關(guān)責(zé)任主體信用管理辦法》要求;近3年內(nèi)在申請各級各類科研項(xiàng)目(課題)中無不良信用記錄,無行政處罰或違法記錄,無不良科研誠信記錄。
3.申報(bào)單位為企業(yè)的,需具備相應(yīng)的資金配套能力,配套經(jīng)費(fèi)與財(cái)政科技經(jīng)費(fèi)比例不低于2:1。
(三)申報(bào)負(fù)責(zé)人
1.申報(bào)負(fù)責(zé)人應(yīng)為申報(bào)單位的正式在職人員,具有良好的職業(yè)道德,無不良行為記錄。在課題申報(bào)時(shí),負(fù)責(zé)人在課題實(shí)施期內(nèi)在職,具有領(lǐng)導(dǎo)和組織開展創(chuàng)新性研究的能力,身體健康并能切實(shí)履行職責(zé),有充足時(shí)間保證課題順利實(shí)施。
2.申報(bào)負(fù)責(zé)人需符合《北京市科技計(jì)劃項(xiàng)目(課題)管理辦法》和《北京市科技計(jì)劃管理相關(guān)責(zé)任主體信用管理辦法》要求。申報(bào)負(fù)責(zé)人作為負(fù)責(zé)人同期承擔(dān)北京市科委、中關(guān)村管委會(huì)課題原則上不超過1項(xiàng),作為主要參加人員同期參與課題數(shù)(含擔(dān)任負(fù)責(zé)人的課題)原則上不超過2項(xiàng)。
四、申報(bào)方式
1.采取在線申報(bào)方式,申報(bào)單位通過法人一證通登錄“北京市科技計(jì)劃綜合管理平臺(tái)-在線服務(wù)系統(tǒng)”(https://mis.kw.beijing.gov.cn/)更新本單位信息后(以自然人賬號申報(bào)的,需綁定單位后再填報(bào)),點(diǎn)擊“項(xiàng)目申報(bào)”,選擇“北京市科學(xué)技術(shù)委員會(huì)、中關(guān)村科技園區(qū)管理委員會(huì)關(guān)于征集2025年AI+多語種翻譯方向儲(chǔ)備課題的通知”,點(diǎn)擊申報(bào)方向,完成課題申報(bào)材料填寫,主要包括:課題實(shí)施方案、項(xiàng)目課題簡表、負(fù)責(zé)人及申報(bào)單位承諾書(需簽字蓋章),并上傳申報(bào)課題所需的其他證明性材料。或登錄北京市人民政府門戶網(wǎng)站“政策兌現(xiàn)”欄目(https://zhengce.beijing.gov.cn)選擇相對應(yīng)的項(xiàng)目進(jìn)行申報(bào)。
2.申報(bào)系統(tǒng)將于2025年8月4日(星期一)14:30至8月15日(星期五)18:00期間開放,截止時(shí)間后系統(tǒng)自動(dòng)關(guān)閉。申報(bào)單位需在系統(tǒng)開放期間完成本單位申報(bào)課題審核并統(tǒng)一提交,系統(tǒng)關(guān)閉后將不再受理。
五、咨詢服務(wù)
咨詢電話:廖老師010-88828855
技術(shù)支持電話:010-58858689、010-58858681、010-58858685、010-58858680
咨詢服務(wù)時(shí)間:9:00—11:30,13:30—18:00(工作日)
北京市科學(xué)技術(shù)委員會(huì)、中關(guān)村科技園區(qū)管理委員會(huì)
2025年8月4日
分享到: