星河搜索,是由攝星智能科技有限公司(starsee)研發的全球視角智能防務信息服務平臺。該平臺在設計之初,就立足于運用先進的大數據與人工智能技術,實現軍事領域開源海量數據(603138)的智能挖掘與處理,為廣大互聯網用戶提供專業優質的軍事信息服務。其在設計和實現的過程中運用了大量的團隊在人工智能和大數據領域的核心技術。
(星河搜索產品)
? 跨模態信息挖掘與場景理解,實現多模態數據綜合應用
人類對外界的感知和理解是全方位的、多模態的,通過“耳濡目染”、“沁人心脾”才能“觸景生情”。反觀現有的人工智能技術的研究,卻是不同模態各自發展的,研究領域被人為劃分為計算機視覺、自然語言處理、語音識別等,這就造成了不同模態數據應用上的鴻溝,使得算法與模型對客觀世界的認識是片面的、碎片化的。針對這一問題,星河搜索將跨模態數據的處理與分析作為首要目標,并通過圖像、視頻的多層次語義級理解,多語種語音自動識別與對齊,圖像、視頻中實體自動識別與關聯等技術,打通了各模態之間的隔閡,實現了多模態數據的結構化映射,跨模態數據的檢索等,使得用戶可以全面的獲取搜索對象的多模態信息。
(人物屬性自動識別與關聯,演說內容自動識別)
? 實體的模糊化抽取與關聯,消除實體對齊的歧義性
對于實體的抽取與關聯是建立實體圖譜的前提條件,由于星河搜索面對海量復雜的信息來源,同一個實體會由于其數據源的語種、模態、場景會造成大量的歧義。如何識別同一個實體的不同歧義項,是保證不同源信息準確關聯的關鍵。針對這一問題,星河搜索在實體抽取中引入概率圖以及先驗模型,以概率的方式將先驗知識與與訓練模型相結合,從而提高實體抽取的準確性;在實體關聯時,通過對實體的其他屬性信息(如國別、地域、機構等)進行表征學習和檢索,消除歧義,提高關聯的準確性。
? 在線增量式終身學習,使得模型持續學習,自我完善
終身的持續學習是人類所具備的基本技能,而這種基本技能確是現有的機器學習技術,特別是以深度學習為代表的新一代機器學習技術所不具備的。這主要是由于數據驅動模型所固有的“災難性遺忘”的特性所導致的,這也造成了深度學習模型像狗熊掰玉米一樣,學了新的忘了舊的。而對于星河搜素,每天需要面對大量紛繁復雜的多模態數據,并且很多信息都具有實效性,這就使得在線持續的從新數據中學習,并且不斷的矯正舊知識成為剛需。針對這一問題,星河搜索通過綜合最新的領域自適應、小樣本學習、對抗性訓練、魯棒性訓練以及深度學習模型可解釋等領域的研究成果,以非常低的成本,實現了模型對新知識的增量學習和動態更新。
? 深度神經網絡的調校和優化,保證模型的高效性能輸出
如上面的分析,深度神經網絡逐漸成為現有機器學習領域研究的支撐技術,因此深度神經模型性能調校的水平,直接決定上層應用效果的好壞。通過長期在該領域的深耕,星河搜索也積累了一系列深度神經網絡模型設計與調教的方法。如跨模態模型的在線知識蒸餾,實現不同模態之間知識的動態流動和對齊;模型的壓縮與動態推理,使得模型可以針對不同任務激活部分神經元參與計算;模型的可解釋分析與構建,揭示深度學習模型的推理過程。通過這些原創性方法,使得星河搜索構建在堅實可靠的深度學習模型和算法的基礎上,從而使其性能優于一般的開源方法與模型。
攝星智能公司介紹:
攝星智能科技有限公司(Starsee)成立于2018年9月,是國內第一家軍事智能化企業,公司通過引入先進的人工智能技術和作戰理念,將自主研發的軍用智能算法和軟件在不同硬件產品形態上實現集成,為未來智能化作戰增效賦能。
星河搜索,攝星智能旗下自研的面向全球視角的智能防務信息服務平臺。基于開源互聯網數據,融匯貫穿泛軍事、全球化、全鏈路、多模態、多語言的開源信息,綜合運用人工智能和大數據技術,實現了智能數據采集、深度知識挖掘、多模態情報分析、智能態勢感知和輔助決策等能力,為互聯網上的廣大軍事愛好者、軍工從業人員、現(退)役軍人以及其它用戶群體,提供軍事動態實時推送、目標圖像精準識別、人物/裝備一點鏈網、軍事文獻深析匯聚、軍事知識綜合檢索等功能和服務。
(星河搜索產品)
攝星智能近期開啟新一輪“百萬年薪人才引進計劃”,大力招募資深算法專家、NLP、CV、機器學習等方向的精英人才,主要負責新型產品研發及領域內技術科研工作。歡迎優秀人才加入攝星,一起為國防智能化建設貢獻力量。
關鍵詞: