首頁 > 互聯網 > > 正文

              克隆真人語音只要1句話,AI問診超96.4%全科醫生!科大訊飛年度黑科技大秀,余承東都來了

              2021-10-26 09:13:02    來源:量子位 微信號

              楊凈 蕭簫 發自 凹非寺

              量子位 報道 | 公眾號 QbitAI

              企業擁有265萬開發者是一種什么體驗?

              是在最新財報上已經商業變現,開放平臺營收增速高達131%?

              是連續5年在合肥振臂一呼,全球就迅速響應?

              當然,這還不是全部。

              在這一次開發者節上,科大訊飛(002230,股吧)董事長劉慶峰向全球開發者,攤開過去一年答卷。

              科大訊飛AI開放平臺,至今已有441項核心技術;

              每個月平均新增9萬開發者團隊,其中工業應用占比達到60%;

              醫療AI系統一年給出97萬份修正診療結果……

              而像“遇強則強,遇弱則弱”的圍棋機器人、1分鐘定制專屬AI數字人、3秒判斷聲音畫像等這些技術成果更是成為展區的爆款!

              第五屆全球開發者節究竟有何看頭?現在就帶你一文看盡。

              科大訊飛最新技術成績

              今年1024開發者節上,最先登場的科大訊飛董事長劉慶峰披露了取得的一系列最新成績。

              其一,AI健康咨詢準確率超過絕大部分全科醫生。

              在你就診時,健康咨詢AI系統會根據你的相關健康狀況,推薦你去對應醫院找專家就診。據劉慶峰介紹,目前科大訊飛的健康咨詢AI系統,已經超過96.4%的通過國家考試的全科醫生。

              其二,醫療AI系統一年給出97萬份修正診療結果。

              在過去一年中,科大訊飛的AI輔助診療系統,協助修正了97萬份安徽省基層醫生看病的診療初步結果。依賴于科大訊飛的醫療AI輔助診療系統,安徽基層醫生合理診斷度已經從70分提升到了80分,整體系統準確率已經達到97%以上。

              其三,AI開放平臺核心技術達到441項。

              2010 年,科大訊飛開放平臺正式上線,集成了語音合成、語音搜索、自然語言處理和語音聽寫等多項能力,成為當時行業內開放最早的智能語音平臺。如今,科大訊飛已經從最初的3項核心技術,進化到今天具備的441項核心AI能力與方案。

              其四,1句話就能語音合成1個人的聲音。

              據劉慶峰介紹,科大訊飛正在不斷的持續打造人工智能的核心技術的領先引擎,包括無監督訓練等技術,讓機器用更小的數據、更少的標注學習更多的知識,現在在語音合成上已經實現一句話就能模仿一個人的音色。

              在小語種識別上,科大訊飛提出的統一空間表達的半監督語音識別技術,使得研究人員只用100個小時的有監督語音和無標簽文本數據訓練,就能達到之前10000小時有監督語音數據訓練的效果。

              其五,用AI讓學生無效作業時間平均降低50%。

              據劉慶峰介紹,科大訊飛在安徽合肥率先用人工智能助力“雙減”,利用AI復雜系統,結合OCR自動評分、語音推理等技術,分析學生的學習情況,對過程性作業考試數據進行評價,精準給予指導,將孩子的無效作業時間平均降低了50%。

              這一系列亮眼的成績之上,劉慶峰公開了科大訊飛AI開放平臺2.0戰略,共包括6大措施:

              劉慶峰表示,行業關鍵問題,需要各行業的人共同努力:

              開發者可以不了解AI技術,只要有靈感、創意和想象力,就可以加入到AI開放平臺2.0來。

              只有生態的繁榮,才能決定AI的未來。

              AI開放平臺2.0升級

              接下來,基于過去5年的開發者生態積累,科大訊飛總裁吳曉如提出1024計劃5.0——用系統性創新,打造人工智能產業新生態。

              當中最重要的部分,就是AI開放平臺2.0的發布。

              與過去1.0相比,簡單來說,就是二維到三維的升級。

              以往的解決方案,都是單向提供給創業伙伴,但隨著人工智能逐漸向傳統產業落地,需要解決的問題更為復雜,需要系統性架構來解決。

              既然如此,就需要與行業龍頭打造基線底座模型,再與上下游合作伙伴展開合作,形成完整的行業方案。

              以智慧農業為例。

              訊飛就與中國農業大學展開合作,共同研發預測生產模型、澆水施肥模型等,然后提供給傳感器等上下游供應商,共同將方案提供給業內的合作伙伴。

              目前,科大訊飛首次推出18個行業,并表示將每年投入5億研發基金,服務100萬開發者。

              既然如此,那該如何推動開放平臺2.0的戰略?有四大維度。

              1、與高校合作開設人工智能專業,目前已經開發339門課程,培養超60萬開發者。

              2、與合作伙伴籌建智能語音創新中心,為每個行業制定標準測試環境。

              3、舉辦頂尖賽事,選出行業標桿。正如此次1024開發者節,就舉辦了兼具行業應用、學術研究、公益等105個賽道賽事,共有兩萬多支隊伍報名。

              3、孵化創新企業,提供優質資源。除了中國聲谷之外,訊飛在全國共有十余家雙創基地。

              四大技術方向突破

              接著,科大訊飛高級副總裁、AI研究院院長胡國平,就分享了四大技術方向的突破。

              嗯,實際上就是去年發布的“AI科技樹”,今年已然開出一些果來。

              第一項,端到端建模技術。

              這項技術將前端多路信號直接同步輸入到后端聲學模塊,來實現更精細的建模,可實現復雜(比如嘈雜環境)場景下的一體化語音識別、語音翻譯等。

              在語音識別上,以賣場為例,這項技術成功將只有35%的語音識別準確率,提升到了88%;同時語音喚醒的成功率,也成功從40%提升到了90%。

              在語音翻譯上,科大訊飛還成功在IWSLT國際口語機器翻譯大賽的同傳任務上,包攬了三個賽道的冠軍。

              第二項,無監督訓練技術。

              為了降低對語音合成數據規模的要求,科大訊飛提出了聽感量化編碼,充分借助語音識別數據來合成音庫,成功實現了多人混合模型訓練。

              在小語種識別上,提出的統一空間表達的半監督語音識別技術,使得只用100個小時的有監督語音和無標簽文本數據,就能達到之前10000小時有監督語音數據訓練的效果。

              在語音合成上,利用無監督訓練甚至實現了發音內容、情感和音色分別可控的效果,例如1句話合成語音、方言自由切換等等……

              注意,不止是普通的四川和合肥話,科大訊飛甚至開放了6種船新的少數民族語種:

              第三,多模態融合技術。

              在人機交互上,現在甚至已經不需要喚醒詞了,機器會看到你的嘴型,從而自動判斷你“是否在對它說話”,并自動做出應答,誤喚醒率降低到0.01%。

              在復雜文檔(例如試卷)識別上,多模態技術會結合OCR、手寫數學公式識別等技術,將一張紙上的所有信息準確識別出來,已經實現教輔作業批改準確率從92%進化到98%的效果。

              第四,外部知識融入技術。

              我們都知道,做語音交互的AI總是有點“呆”,這是因為它們雖然學習了不少技術知識和新科技,但對人類的一些常識掌握得卻還不夠深。

              為了提升AI在這方面的“人情味”,科大訊飛特意將人類的常識和知識整理成一個事理圖譜。

              像兒童玩具交互場景中,就包括“搶玩具”“收拾玩具”這樣具體的動作,讓它知道人類平時會做、會說的事情。

              這樣,在面對小朋友亂拋玩具時,AI就能從容說出“來收拾一下玩具”這樣的語句,而不是只會幫小朋友一遍遍親自收拾玩具。

              又例如電子病歷場景下,運用外部知識融入技術也能讓AI學習到人類醫生看病的經驗,最終將罕見病診斷率從87%提升到了93%,整體病情判斷準確率從92%提升到了95%。

              兩大平臺+生態助力產業

              最后面向合作伙伴,科大訊飛交出自身探索成果——

              兩大平臺+兩大生態。

              首先是企業數字化平臺的發布和虛擬人交互平臺的開放。

              簡單來說,這個企業數字化平臺其實是原來的AI開放平臺基礎上,配置了RPA引擎,從而具有智能化、自動化(RPA)、低代碼、流程管理等特性。

              以智能招聘為例,這位“虛擬小助理”可以在前期分發信息、電話通知等重復性工作上替代HR的工作,據稱流程至少提效10倍。

              除了企業數字化平臺的發布以外,還開放了虛擬人交互平臺。

              值得一提的是,在傳統意義上開放給開發者外,還接受聲音、形象提供者提供相應的數據,以應用于各類應用場景。

              實際上,在過去一年里,這個交互平臺已經在400+個企業客戶進行試點,應用在了新聞生產、企業客服、泛娛樂營銷等場景,新增54個形象,匯集了4988份聲音。

              接著,就是科大訊飛過去一年中成績最顯著的兩大生態:教育+城市。

              在教育生態上,科大訊飛今年提出了三大計劃,包括教育科研基金資助計劃,即在未來三年投入1個億的科研基金,開展前沿的理論與應用的研究;

              此外合作伙伴聯合創新計劃,設立創新孵化投資基金,每年投入1億元,技術上提供300人以上的技術和市場領域的專家服務;

              還有教學教研聯盟的公益計劃,預計新增建設10個區域聯合教研機構、100所名校聯盟新增合作校,推動內容共創平臺新增骨干教研員1萬名。

              在城市生態上,據科大訊飛高級副總裁張友國表示,科大訊飛預計在2025年的智慧城市中,實現一年銷售收入150億,在“十四五”期間實現約500億收入,其中預計60%(約300億)的收入,科大訊飛都會分享給生態合作伙伴。

              人工智能的未來:由表及里的生態

              一天發布會下來,聽到最多的一個關鍵詞就是生態。

              隨著浪潮向前,人工智能不再像此前那般是一個觸不可及的概念,而是真正普惠于民、用之于民的全民技術。

              “幫助每個人、陪伴每個人、更懂每個人”,這是科大訊飛所描述的AI未來。

              而預見未來最好的方式,就是共創未來。

              去年這個時候,劉慶峰在演講的最后提到,唯有生態,才能生生不息。

              今年開發者節上,“生態”的味道更加明晰,從技術、到產業,再到開發者從內到外全面滲透。

              作為一家上市13年的老牌企業,正在用這種方式去完成人工智能產業的全面盛放。

              One More Thing

              對了,在本次開發者節上,還有其他意想不到的亮點。

              比如,安徽人余承東回到家鄉,在父老鄉親面前“帶貨”。(手動狗頭)

              本文首發于微信公眾號:量子位。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。

              相關熱詞搜索: 科大 技術 AI 平臺 語音 開放 合作 人工智能

              上一篇:雷孜LaCie 500GB移動SSD評測:小巧精致高顏值 讀寫雙破1GB/s
              下一篇:中國如何贏得新一輪超算競賽?關鍵在向數據密集型超算轉變

              熱點話題

              熱點推薦

              頭條

              ? 亚洲JIZZJIZZ中国少妇中文| 亚洲日韩av无码| 亚洲天堂男人天堂| 成人亚洲国产va天堂| 亚洲白嫩在线观看| 亚洲精品福利网站| 亚洲成人免费在线| 亚洲国产一区国产亚洲 | 黑人精品videos亚洲人| 亚洲精品精华液一区二区| 中文字幕亚洲精品无码| 亚洲妇女熟BBW| 亚洲熟女精品中文字幕| 亚洲精品乱码久久久久久V| 亚洲av无码兔费综合| 色九月亚洲综合网| 亚洲v国产v天堂a无码久久| 日本中文一区二区三区亚洲| 亚洲国产精品人人做人人爽| 国产成人精品亚洲精品| 丁香五月亚洲综合深深爱| 亚洲人成网站在线播放vr| 久久精品国产亚洲AV麻豆王友容| 久久精品国产亚洲av麻| 亚洲综合精品一二三区在线| 亚洲色图校园春色| 国产色在线|亚洲| 亚洲色大成网站WWW国产| www亚洲精品久久久乳| 亚洲国产综合精品中文字幕| 亚洲熟妇av一区二区三区| 亚洲AV无码一区东京热久久| 亚洲欧洲日产国码高潮αv| 亚洲综合色自拍一区| 亚洲AV无码一区二区乱子伦| 亚洲精品自拍视频| 亚洲xxxx视频| www.91亚洲| 日韩亚洲人成在线综合日本| 亚洲视频在线观看网址| 亚洲日本久久久午夜精品|