亚洲精品国产情侣av在线_91亚洲国产成人久久精品网站_亚洲AV无码专区电影在线观看_亚洲AV无码专区亚洲AV桃

首頁 > 新聞 > > 正文

OpenAI發(fā)布WebGPT模型 可在線搜索問題組織答案并添加引用來源

2022-01-14 08:13:31    來源:智東西

OpenAI 基于 AI 模型 GPT-3 發(fā)布了 WebGPT,該模型可在線搜索問題組織答案,并添加引用來源,更準確地回答開放式問題。

在回答問題時,WebGPT 可以通過瀏覽器進行搜索,在不同鏈接中尋找相關答案,并在最后組織答案時,將引用來源標注上去,使得答案來源的準確性有跡可循。

2020 年 6 月,OpenAI 公開了當時史上最強大 AI 模型 GPT-3,花費數千萬美元,訓練量達 2000 億個單詞,WebGPT 模型是對 GPT-3 進行微調后的成果。

OpenAI 稱:“我們很高興開發(fā)更通用、智能的 AI 模型,但挑戰(zhàn)依然存在,例如應對不熟悉的開放式問題時,AI 模型的回答還不是很準確。”

一、長江跟尼羅河誰更長?AI 幫你上網搜答案

像 GPT-3 這樣的語言模型可以充分應對不同的任務,但對于那些在現實世界中都沒有準確答案的任務,這個模型往往會產生一些充滿“迷惑”的信息。

為了解決這個問題,研究人員教 AI 模型使用網絡瀏覽器對問題進行“百度”。該模型中包含“搜索……”、“在頁面中查找:……”或“引用:……”之類的命令,遇到開放式問題,WebGPT 可以模仿人類搜索的行為來自動檢索答案。

通過這種方式,WebGPT 模型就學會了從網頁中收集段落,然后使用這些段落來撰寫答案。

當被問道:“尼羅河和長江誰更長?”

WebGPT:“尼羅河比長江長。尼羅河在維多利亞湖和地中海之間綿延 6650 公里(4130 英里)。長江從青海唐古拉山脈的源頭到東海,全長 6300 公里(3915 英里)。”

當被問道:“為什么蘇伊士運河在 2021 年 3 月被封鎖?”

WebGPT:“蘇伊士運河于 2021 年 3 月被封鎖,因為一艘名為‘永遠’的集裝箱船擱淺在那里。這艘船曾載著 20000 箱的貨物,在有兩條水道的運河河道被強風吹進了運河中,因此其他船只無法繞過曾經給定的航道。蘇伊士運河管理局雇傭了一艘拖船將這條曾經被遺棄的運河拖出運河。運河阻塞對歐洲、亞洲和中東之間的貿易產生了重大的負面影響。這引發(fā)了集裝箱現貨運價的新一輪飆升,該運價最終開始從創(chuàng)紀錄的高點回落。”

當被問道:《哈利波特》系列和《指環(huán)王》哪一部有更多的單詞?

WebGPT:“《指環(huán)王》三部曲比《哈利波特》系列包含更多的單詞。包括《霍比特人》,整個《指環(huán)王》系列包含 576459 個單詞。相比之下,《哈利波特》系列包含 1084170 個單詞。”

研究小組對 GPT-3 的微調與最開始對 GPT-3 的訓練方法一樣。他們首先訓練模型模仿人們回答問題的方式,這使它能夠使用基于瀏覽器檢索到的內容來回答問題。

然后,他們通過訓練激勵模型來預測人類偏好,并使用強化學習或拒絕采樣(隨機采樣方式)對其進行優(yōu)化,從而提高模型答案的有用性和準確性。

二、超一半回答優(yōu)于人類,但可能引用不可信來源

ELI5 是一個用來對機器學習模型調試的 Python 庫,研究人員挑選了這個庫中“像我五歲一樣解釋(Explain Like I'm Five)”欄目里的開放式問題,發(fā)現經過系統訓練的 WebGPT 已經可以回答其中的問題了。

研究人員說,他們訓練了三種不同的 AI 模型,對應于三種不同的 inference time(推理時間)來進行計算。結果表明,表現最好的模型產生的答案,在 56% 的時間里比人類演示者寫的答案更受歡迎,并且答案的事實準確性相近。

研究人員稱,未來他們將使用人工反饋來改進模型的答案,可能會最終超越人類的答案。

對于模型的訓練分布(training distribution)來說,這三個模型中,最好的模型的答案與人類演示者所寫的答案幾乎一樣準確。然而,研究人員稱,實現所有模型都能達到穩(wěn)健是一個挑戰(zhàn)。

為了探討這個問題,研究人員在 TruthfulQA 上評估了該模型,TruthfulQA 是一個數據集,包含了很多容易產生誤解的問題,可以測試模型是否會產生常見的誤解。在這個過程中,問題的答案會根據真實性和信息量進行評分,例如,“我沒有評論”這個答案就被認為是真實的但不提供信息。

WebGPT 模型在 TruthfulQA 上的表現優(yōu)于 GPT-3,并表現出更有利的縮放特性,不過模型落后于人類答案的部分原因是它們有時會引用不可靠的來源。研究人員希望使用對抗性訓練等技術來減少這些失敗的頻率。

三、公開信息佐證,AI 也可以加引用

為了增加人類反饋對提高事實準確性的作用,研究人員必須能夠評估模型產生答案的事實準確性。對于研究人員來說,這極具挑戰(zhàn)性,因為有些答案可能是主觀的或含糊不清的。

出于這個原因,研究人員為模型增加了“引用來源”功能。這使人們可以通過檢查答案,是否得到了可靠的信息支持,并評估事實的準確性。除了使任務更易于管理外,這項功能還減少了答案歧義。

然而,這種方法也提出了許多問題。來源可靠的判定標準?哪些聲明足夠確定不需要支持?在評估事實準確性和其他標準之間應該進行什么權衡?所有這些都是艱難的判斷。

研究人員認為,WebGPT 仍然存在一些基本錯誤,很多細微差別沒有被發(fā)現。“但我們預計,隨著人工智能系統的改進,這類決策將變得更加重要,需要跨學科研究來制定既實用又符合認知的標準,我們還預計透明度等進一步的考慮很重要。”

WebGPT 通過引用來源其實不足以評估事實準確性。研究人員提到,一個足夠強大的模型會精心挑選它認為可以令人信服的來源,即使這個來源有可能沒有準確的證據。研究人員提出了一種新的解決辦法就是:增加辯論過程來獲得答案。

WebGPT 模型通常比 GPT-3 更“真實”,它生成錯誤陳述的頻率也更低,但這個模型仍然存在很多風險。OpenAI 說:“帶有引用的答案通常被認為具有權威性,這可能會掩蓋我們的模型仍然存在基本錯誤的事實。”WebGPT 還傾向于強化用戶的現有信念。

除了這些部署風險之外,如果允許 WebGPT 向各種瀏覽器發(fā)送查詢并跟蹤 Web 上已存在的鏈接,這也可能會增加新的風險。

結語:GPT-3 大模型取得新進展

曾經可以寫小說、敲代碼、編劇本的 GPT-3 模型在研究人員手中,又學會了自動檢索。但根據 GPT-3 的訓練經驗來看,這些風險可能還不足以產生危機。然而,隨著模型的智能化逐漸深入,在未來是否會產生更大的風險?

人類反饋和 Web 瀏覽器等工具為實現穩(wěn)健、真實的通用 AI 模型提供了一條有希望的途徑。OpenAI 稱,AI 模型在充滿挑戰(zhàn)或不熟悉的情況下不斷掙扎,但在這個方向上他們仍然取得了重大進展。

相關熱詞搜索: OpenAI 微軟 GitHub AI編程工具

上一篇:美國科學家調研發(fā)現 近兩成高血壓患者在服用升壓藥
下一篇:貝殼再次回應做空報告 稱渾水抓取交易量數據方法錯誤

熱點話題

熱點推薦

頭條

? 亚洲精品国产情侣av在线_91亚洲国产成人久久精品网站_亚洲AV无码专区电影在线观看_亚洲AV无码专区亚洲AV桃

              一区二区三区日韩欧美精品| 中文字幕一区二区不卡 | 色婷婷一区二区| 亚洲国产精品视频| 天天影视色香欲综合网老头| 在线观看亚洲精品| 欧美精品在线视频| 日韩午夜激情免费电影| 精品国产91九色蝌蚪| 欧美激情一区二区三区不卡| 中文字幕亚洲一区二区av在线 | 另类的小说在线视频另类成人小视频在线 | 一区二区在线观看不卡| 亚洲国产裸拍裸体视频在线观看乱了| 亚洲午夜久久久久久久久电影网| 色婷婷精品久久二区二区蜜臀av| 欧美伊人久久久久久午夜久久久久| 欧美精品1区2区| 欧美精品一区二区三区久久久| 欧美激情在线免费观看| 亚洲欧美激情小说另类| 天天影视网天天综合色在线播放| 精品一区中文字幕| 不卡免费追剧大全电视剧网站| 国产亚洲1区2区3区| 亚洲色图丝袜美腿| 在线精品亚洲一区二区不卡| 欧美群妇大交群中文字幕| 精品91自产拍在线观看一区| 成人免费在线观看入口| 午夜精品爽啪视频| 国产另类ts人妖一区二区| 久久蜜桃一区二区| 亚洲精品久久久久久国产精华液| 91久久免费观看| 日韩美女在线视频| 国产精品盗摄一区二区三区| 午夜激情综合网| 国产盗摄视频一区二区三区| 国产午夜一区二区三区| 亚洲高清中文字幕| 日韩片之四级片| 日韩美女啊v在线免费观看| 免费看欧美女人艹b| caoporm超碰国产精品| 中文字幕亚洲成人| 欧美三级中文字幕| 亚洲国产精品精华液2区45| 性感美女久久精品| 成人av午夜电影| 亚洲女同女同女同女同女同69| 欧美亚洲另类激情小说| 久久久蜜臀国产一区二区| 亚洲国产视频一区| 成人影视亚洲图片在线| 中文字幕一区二区5566日韩| 欧美午夜精品理论片a级按摩| 久久久国际精品| 婷婷丁香久久五月婷婷| 91玉足脚交白嫩脚丫在线播放| 亚洲在线观看免费| 精品久久久久久综合日本欧美| 亚洲女厕所小便bbb| 国产乱淫av一区二区三区| 国产精品视频一二| 欧美日韩国产美女| 亚洲免费观看高清完整版在线| 国产真实乱子伦精品视频| 中文字幕亚洲电影| 欧美一二三区精品| 亚洲一区二区三区中文字幕在线| 懂色av一区二区三区蜜臀 | 欧美三级在线视频| 国产精品传媒在线| 国产精品亚洲一区二区三区妖精| 国产精品女同一区二区三区| 欧美人体做爰大胆视频| 亚洲精品少妇30p| 亚洲人成网站精品片在线观看| 国内精品久久久久影院一蜜桃| 国产精品天天看| 欧美一区在线视频| 亚洲国产精品自拍| 91捆绑美女网站| 欧美在线视频日韩| 亚洲乱码日产精品bd| av在线不卡观看免费观看| 一本色道综合亚洲| 最新国产の精品合集bt伙计| 福利视频网站一区二区三区| 亚洲午夜一区二区三区| 中文字幕欧美激情一区| 国产剧情在线观看一区二区| 亚洲激情自拍视频| 久久久99久久精品欧美| 久久成人精品无人区| 亚洲免费av网站| 国产午夜精品理论片a级大结局| 精品亚洲国产成人av制服丝袜| 亚洲欧美日韩国产一区二区三区| 精品理论电影在线观看 | 五月激情综合婷婷| 国产精品女同互慰在线看| 日韩欧美一区在线| 蜜臀av一级做a爰片久久| 中文字幕亚洲在| 久久精品一区二区三区不卡 | 日韩国产一二三区| 国产精品久久久久久久久果冻传媒 | 岛国一区二区在线观看| 色婷婷精品久久二区二区蜜臀av| 亚洲欧美日韩中文字幕一区二区三区 | 一本色道亚洲精品aⅴ| 亚洲免费观看在线视频| 久久久国际精品| 精品国精品国产尤物美女| 激情综合色播激情啊| 亚洲成人动漫精品| 亚洲视频在线一区二区| 久久久久国产精品厨房| 欧美大片日本大片免费观看| 黄色日韩网站视频| 在线中文字幕一区| 午夜精品久久久久久| 亚洲乱码国产乱码精品精可以看| 国产偷国产偷亚洲高清人白洁| 国产成人三级在线观看| 欧美色图激情小说| 日本欧美一区二区在线观看| 亚洲激情男女视频| 亚洲欧美日韩成人高清在线一区| 久久久五月婷婷| 精品欧美黑人一区二区三区| 国产精品一区久久久久| 一本大道久久a久久精二百| 亚洲一区二区av在线| 自拍偷拍国产精品| 亚洲日本韩国一区| 国产精品国产三级国产普通话三级 | 91亚洲男人天堂| 精品久久久久久久久久久久久久久 | 欧美三级乱人伦电影| 男女男精品网站| 一本到不卡精品视频在线观看| 丝袜美腿高跟呻吟高潮一区| 亚洲最大成人综合| 玉米视频成人免费看| 亚洲视频你懂的| 亚洲精品亚洲人成人网| 亚洲日韩欧美一区二区在线| 亚洲久本草在线中文字幕| 亚洲视频综合在线| 亚洲国产另类av| 亚洲国产欧美另类丝袜| 日韩高清不卡一区| 91豆麻精品91久久久久久| 看片网站欧美日韩| 欧美人狂配大交3d怪物一区| 国产精品小仙女| 日韩你懂的在线播放| 波多野结衣在线aⅴ中文字幕不卡 波多野结衣在线一区 | 国产呦精品一区二区三区网站| 精品视频在线免费观看| 国模娜娜一区二区三区| 欧美一区二区三区男人的天堂| 亚洲欧美在线另类| 国产精品网站在线观看| 最新国产成人在线观看| 1区2区3区精品视频| 亚洲一区二区黄色| 一本一道综合狠狠老| 黄色小说综合网站| 日韩一本二本av| 99免费精品在线观看| 国产欧美日韩激情| 国产精品剧情在线亚洲| 一区二区三区在线免费观看| 亚洲国产精品一区二区久久 | 亚洲国产精品精华液网站| 日韩av一区二区在线影视| 欧美性生活久久| 国产成人免费视频一区| 久久精品人人爽人人爽| 国产精品美女久久久久久久 | 国产精品美女久久久久久久久| 国产精品欧美综合在线| 最近中文字幕一区二区三区| 亚洲成av人在线观看| 欧美曰成人黄网| 粉嫩av一区二区三区粉嫩| 日本一区二区视频在线| 亚洲特黄一级片| 美洲天堂一区二卡三卡四卡视频| 5858s免费视频成人| 91一区二区在线观看| 1区2区3区精品视频| 午夜精品久久久久久久| 国产高清不卡二三区| 国产人成亚洲第一网站在线播放| 18涩涩午夜精品.www|