<ul id="ouw02"></ul>
  • 首頁 > 技術(shù) > 正文

    聊天機器人ChatGPT能力波動:質(zhì)數(shù)識別準確率下降

    2023-09-08 08:04:14來源:中關(guān)村在線  


    (資料圖)

    斯坦福大學的一項新研究發(fā)現(xiàn),熱門生成式人工智能(AI)聊天機器人ChatGPT的能力在幾個月內(nèi)有所波動。研究人員評估了ChatGPT在幾個月內(nèi)如何處理不同的任務,發(fā)現(xiàn)ChatGPT的能力隨時間推移而出現(xiàn)不一致。目前,ChatGPT有兩個版本,免費的GPT-3.5模型和更智能、更快速的付費GPT-4版本。研究人員發(fā)現(xiàn),GPT-4在3月份能夠有效地解決數(shù)學問題,識別質(zhì)數(shù)的準確率為97.6%。但三個月后,其準確率下降到了2.4%。而另一方面,GPT-3.5卻變得更好,從7.4%的準確率提高到了86.8%。研究人員還注意到,在編寫代碼和視覺推理方面也有類似的波動。斯坦福大學計算機科學教授James Zou表示:“當我們調(diào)整一個大型語言模型來提高它在某些任務上的表現(xiàn)時,那可能會有很多意想不到的后果,可能會損害這個模型在其他任務上的表現(xiàn)……這個模型回答問題的方式有各種各樣的相互依賴性,這可能導致我們觀察到的一些惡化行為。”研究人員認為,結(jié)果并不能真正反映ChatGPT性能的準確性狀態(tài),而是顯示了微調(diào)模型帶來的意外后果。本質(zhì)上,當修改模型的一部分來改善一個任務時,其他任務可能會受到影響。為什么會這樣很難確定,因為沒有人知道ChatGPT是如何運作的,而且它的代碼也不是開源的。隨著時間的推移,研究人員注意到,ChatGPT的回答不僅變得不太準確,而且還停止了解釋其推理過程。由于ChatGPT的運作方式,要研究和衡量其表現(xiàn)可能很困難。這項研究強調(diào)了觀察和評估驅(qū)動ChatGPT等工具的大型語言模型(LLM)性能變化的必要性。該研究已經(jīng)在arXiv上發(fā)布,并正在等待同行評審。

    標簽:

    相關(guān)閱讀

    精彩推薦

    相關(guān)詞

    推薦閱讀

    亚洲国产成人久久一区二区三区| 亚洲女女女同性video| 亚洲精品无码av片| 亚洲国产精品综合久久20| 亚洲精品国产福利在线观看| 亚洲专区在线视频| 7777久久亚洲中文字幕蜜桃| 久久精品国产亚洲AV无码娇色| 亚洲AV无码日韩AV无码导航| 亚洲va国产va天堂va久久| 亚洲精品无码永久在线观看你懂的| 国产亚洲精品无码专区| 亚洲尤码不卡AV麻豆| 亚洲欧洲日产国码av系列天堂| 日日噜噜噜噜夜夜爽亚洲精品| 国内精品久久久久久久亚洲| 日日噜噜噜噜夜夜爽亚洲精品| 亚洲精品无码午夜福利中文字幕| 亚洲精品国偷自产在线| 亚洲AV无码日韩AV无码导航| 久久精品亚洲视频| 亚洲精品免费观看| 亚洲经典在线观看| 亚洲AV无码国产精品色| 亚洲中文无码永久免| 日韩欧美亚洲国产精品字幕久久久| 日韩精品亚洲专区在线影视 | 精品无码专区亚洲| 内射无码专区久久亚洲| 亚洲精品国产福利一二区| 国产成人亚洲综合| 亚洲国产无套无码av电影| 亚洲国产日韩一区高清在线| 亚洲精品一卡2卡3卡三卡四卡| 亚洲综合伊人制服丝袜美腿| 亚洲欧美日韩国产成人| 亚洲国产精品13p| 亚洲精品高清国产一线久久| 久久久久亚洲av无码专区喷水| 亚洲国产精品久久人人爱| 亚洲色中文字幕在线播放|