亚洲人成网网址在线看_亚洲国产美女视频_激情综合色五月丁香六月亚洲_亚洲精品在线网站

首頁 > 綜合 > 正文

內存直降50%,token需求少56%!用視覺方式處理長文本

2025-11-01 09:32:34來源:新智元  

新智元報道

編輯:LRST


(資料圖)

【新智元導讀】在NeurIPS 2025論文中,來自「南京理工大學、中南大學、南京林業大學」的研究團隊提出了一個極具突破性的框架——VIST(Vision-centric Token Compression in LLM),為大語言模型的長文本高效推理提供了全新的「視覺解決方案」。值得注意的是,這一思路與近期引起廣泛關注的DeepSeek-OCR的核心理念不謀而合。

在處理短文本時,大語言模型(LLM)已經表現出驚人的理解和生成能力。但現實世界中的許多任務——如長文檔理解、復雜問答、檢索增強生成(RAG)等——都需要模型處理成千上萬甚至幾十萬長度的上下文。

與此同時,模型參數規模也從數十億一路飆升至萬億級別。

在「上下文長度激增」與「模型參數量膨脹」的雙重挑戰下,Token壓縮不再是優化項,而是必需品。

若不能有效縮減輸入規模,即便最強大的大語言模型,也難以高效處理我們需要它分析的海量信息。

南京理工大學、中南大學、南京林業大學的研究人員提出VIST(Vision-centric Token Compression in LLM)框架,正是為了解決這一痛點。

論文鏈接:https://arxiv.org/abs/2502.00791

研究團隊早在一年多以前NeurIPS 2024就開始探索——如何讓模型像人類一樣,以視覺的方式更高效地理解長文本。

論文鏈接:https://arxiv.org/pdf/2406.02547

人類閱讀文章時,不會逐字讀完每一個詞。

「的」「了」「和」這些功能性高頻詞,幾乎是被大腦自動略過的。真正讓我們停下來的,是那些承載意義的低頻詞——名詞、動詞、數字等。

VIST 的核心思想,就是讓大模型也具備這種「選擇性閱讀」能力。

它設計了一種模仿人類「快–慢閱讀通路(Slow–Fast Reading Circuit)」的視覺化壓縮機制,讓大模型在理解長文本時,既能快速掃讀,又能深入思考:

快路徑(Fast Path):將遠處、相對次要的上下文渲染為圖像,由一個凍結的輕量級視覺編碼器快速提取顯著性語義;

慢路徑(Slow Path):將關鍵的近處文本直接輸入 LLM,用于深層推理與語言生成。

這種「視覺+語言」的雙通道協作,就像人類的眼睛與大腦——一邊掃視全局,一邊聚焦要點,深度思考。

VIST讓模型真正具備了「像人一樣速讀」的能力。

憑借這一設計,在處理相同文本內容時,VIST所需的視覺Token數量僅為傳統文本分詞所需Token數量的56%,內存減少了50%。

用「視覺壓縮」解鎖長文本理解

早期的LLM主要通過tokenizer把文本拆分的離散token輸入給LLM去處理,這種范式帶來了很多好處如高度語義化。

但是已有研究發現,經過大規模圖文配對數據預訓練,CLIP等視覺編碼器能夠自發掌握 OCR 能力,這使它們可以直接理解文本圖像內容,為長文本的視覺化處理提供了強大工具。

VIST則借鑒了人類高效閱讀的技巧,提出了一種全新的快–慢視覺壓縮框架,用視覺方式處理長文本,讓模型既能快速掃讀,又能深度理解。

快路徑(Fast Path)

將次要的長距離上下文渲染成圖像,由輕量級視覺編碼器處理;

通過 Resampler 將視覺特征進一步壓縮為4倍;

壓縮后的視覺特征再通過cross-attention與LLM的主輸入整合。

慢路徑(Slow Path)

對近處或核心文本直接交給LLM處理,進行深度推理和語言生成。

這種「掃視遠處,專注近處」的方式,模擬了人類閱讀的自然策略,讓模型在長文本場景下既高效又精準。

概率感知視覺增強

教模型學會略讀

雖然視覺編碼器(如 CLIP)非常強大,但它們主要在自然圖像上訓練,對于渲染文本的理解能力有限。而且,長文本中往往充斥大量冗余信息,如果不加選擇地處理,浪費算力,還會被干擾得抓不住重點。

為此,VIST引入了一個巧妙的機制——概率感知視覺增強(PVE, Probability-informed Visual Enhancement),教模型「略讀」,抓住關鍵信息,忽略冗余詞。

在訓練中,PVE采用基于頻率的屏蔽策略(Frequency-based Masking Strategy)把高頻但信息量低的詞(如英文中的 「the」、「with」)掩碼而重點保留低頻、高信息量詞如名詞、動詞、數字等核心內容。

這些經過語義優化的文本嵌入(embeddings)有效指導Resampler從文本圖像中提取最重要的語義信息,讓視覺壓縮模塊更高效、更精準。

視覺壓縮的極大潛力

在開放域問答(Open-domainQA)任務以及11 個 In-Context Learning(ICL)基準任務上,VIST 顯著優于基于文本編碼器的壓縮方法 CEPE。

即便在極端條件下——所有篇章僅通過視覺編碼器處理——VIST仍能在開放域問答任務中達到與TinyLlama相當的性能,充分顯示了視覺壓縮在長文本處理中的可靠性。

此外,VIST在處理相同文本內容時,所需視覺 Token 數量比傳統文本 Token 少56%(壓縮比約為2.3,從 1024 個文本Token壓縮到448個視覺 Token),同時顯存使用減少50%,極大提高了計算效率。

讓大模型「用眼睛讀文字」

VIST利用輕量級視覺編碼器,將冗長的上下文信息壓縮處理,為大語言模型提供了一條高效、低成本的新路徑。

更妙的是,視覺編碼器還能充當視覺文本分詞器(Visual Text Tokenization),帶來四大優勢:

1. 簡化分詞流程傳統文本分詞器依賴復雜規則和固定詞表,通常涉及近十步人工預處理(如小寫化、標點符號處理、停用詞過濾等)。

視覺編碼器直接將渲染后的文本視作圖像輸入,無需繁瑣預處理,處理流程更直接高效。

2. 突破詞表瓶頸傳統分詞器在多語言環境下容易受詞表限制影響性能,而視覺編碼器無需詞表,統一處理多種語言文本,大幅降低嵌入矩陣和輸出層的計算與顯存開銷。

3. 對字符級噪聲更魯棒視覺編碼器關注整體視覺模式,而非單個 Token 匹配,因此對拼寫錯誤或低級文本攻擊具備天然抵抗力。

4. 多語言高效性盡管本文主要針對英文,視覺文本分詞器在其他語言中同樣高效:與傳統文本分詞相比,可減少62%的日文Token、78%的韓文Token、27%的中文Token,在處理長文本時優勢尤為顯著。

結語與未來展望

VIST 展示了「視覺 + 語言」協作在大模型長文本理解中的巨大潛力:

  • 它讓大模型能夠「像人一樣讀」,快速掃視冗余信息,同時專注于關鍵內容;

  • 它為多語言、長文本、甚至多模態場景提供了高效處理方案。

未來,視覺驅動的 Token 壓縮可能會成為長上下文 LLM 的標準組件。 隨著模型規模不斷增長,這種「先看再讀」的策略,將幫助大模型在保證理解能力的同時,大幅降低計算成本,為多模態智能理解鋪平道路。

參考資料:

https://arxiv.org/abs/2502.00791

標簽: 視覺 內存 上下文 編碼器 新模型 token

相關閱讀

精彩推薦

相關詞

推薦閱讀

亚洲人成网网址在线看_亚洲国产美女视频_激情综合色五月丁香六月亚洲_亚洲精品在线网站
<ul id="ouw02"></ul>
  • 91精彩视频在线| 日本一区二区视频在线观看| 中文字幕在线不卡国产视频| 日韩综合在线视频| 成人精品小蝌蚪| 亚洲精品菠萝久久久久久久| 欧美一区二区视频在线观看| 亚洲男人的天堂一区二区| 国产精品色呦呦| 免费欧美高清视频| jizzjizzjizz欧美| 一区二区三区在线免费观看| 7777精品伊人久久久大香线蕉完整版| 国产精品国产自产拍在线| 日本不卡视频一二三区| 久久看人人爽人人| 欧美亚洲动漫精品| 国产精品狼人久久影院观看方式| 久久精品国产精品青草| 国产精品视频看| 欧美一区二区三区四区高清 | 亚洲激情在线播放| 日韩欧美一区电影| 图片区小说区国产精品视频| 91丨porny丨在线| 在线观看国产一区二区| 亚洲欧美影音先锋| 福利一区二区在线| 亚洲国产欧美在线| 国产亚洲欧美中文| 免费的成人av| 国产精品国模大尺度视频| 欧美一区二区免费视频| 丝袜美腿亚洲一区二区图片| 久久精子c满五个校花| 欧美日韩一区小说| 一区二区三国产精华液| 99久久99久久综合| 在线免费观看视频一区| 经典一区二区三区| 亚洲视频在线一区| 日韩精品专区在线影院重磅| 午夜av区久久| 国产精品久久久久久亚洲伦| 日韩精品资源二区在线| 麻豆成人久久精品二区三区红| 国产精品久久久久三级| 精品播放一区二区| 国产一区二三区好的| 亚洲综合色自拍一区| 亚洲国产精品v| 国产成人精品三级| 91福利视频网站| 亚洲福利视频导航| 亚洲欧洲另类国产综合| 久久免费偷拍视频| 国产高清不卡一区二区| 色域天天综合网| 亚洲综合色网站| 国产精品久久久久一区二区三区共| 精品久久一区二区三区| 国产一区二区在线观看视频| 午夜在线电影亚洲一区| 一区精品在线播放| 久久久影院官网| 精品国产精品网麻豆系列| 国产在线播放一区| 欧美亚洲高清一区二区三区不卡| 亚洲超丰满肉感bbw| 亚洲人成网站精品片在线观看| 国产精品热久久久久夜色精品三区| 成人精品国产免费网站| 在线播放日韩导航| 久久99精品国产.久久久久久| 欧美日韩你懂得| 亚洲成av人在线观看| √…a在线天堂一区| 国产精品久久久久影院色老大| 99久久99久久免费精品蜜臀| 日韩欧美美女一区二区三区| 国产一区二区电影| 欧美日韩免费在线视频| 极品销魂美女一区二区三区| 在线免费观看日本欧美| 丝袜国产日韩另类美女| 亚洲国产一区二区在线播放| 亚洲免费观看高清在线观看| 国产精品电影一区二区| 综合电影一区二区三区 | 天堂久久一区二区三区| 一区二区不卡在线视频 午夜欧美不卡在 | 精品国产欧美一区二区| 丁香桃色午夜亚洲一区二区三区| 欧美高清性hdvideosex| 国产乱码精品1区2区3区| 欧美日韩高清在线| 精品综合免费视频观看| 欧美日韩精品二区第二页| 狠狠色狠狠色综合日日91app| 欧美日韩精品一区视频| 久久99精品国产麻豆不卡| 欧美日韩国产精品自在自线| 国产一区二区三区电影在线观看| 欧美日韩高清影院| 国产精品18久久久久| 日韩视频国产视频| 99re在线视频这里只有精品| 国产亚洲欧洲997久久综合| 国产亚洲一区字幕| 国产精品免费久久久久| 国产精品第13页| 一区二区三区高清不卡| 亚洲风情在线资源站| 日本午夜一本久久久综合| 欧美亚洲国产一区二区三区va | 一二三区精品福利视频| 视频精品一区二区| 欧美日韩视频在线第一区| 国产传媒欧美日韩成人| 精品国产乱子伦一区| 国产三级精品视频| 亚洲三级在线播放| 亚洲综合色噜噜狠狠| 日本va欧美va欧美va精品| 欧美日韩免费电影| www.欧美精品一二区| 国产精品美女久久久久久2018| 成人欧美一区二区三区视频网页| 亚洲一二三四在线观看| 欧美亚洲一区二区在线| 成人天堂资源www在线| 欧美国产激情一区二区三区蜜月 | 亚洲品质自拍视频| 亚洲国产精品一区二区www| 久久99精品久久久久久| 精品国产一区二区三区四区四| 国产婷婷色一区二区三区在线| 亚洲靠逼com| 91久久精品日日躁夜夜躁欧美| 国产精品888| 欧美国产激情二区三区 | 亚洲综合久久久| 在线观看日韩高清av| aaa亚洲精品| 亚洲色图视频网| 欧洲一区二区av| 97精品久久久久中文字幕| 综合自拍亚洲综合图不卡区| 色欧美片视频在线观看在线视频| 高清日韩电视剧大全免费| 国产欧美日韩久久| 亚洲综合成人网| 国产精品99久久久久| 国产精品美女久久福利网站| 亚洲国产日韩a在线播放性色| 国产福利一区二区三区在线视频| 久久久久久久久久久久电影| 亚洲伦理在线精品| 国产乱妇无码大片在线观看| 国产精品乱人伦一区二区| 日本久久电影网| 久久色在线视频| 亚洲va韩国va欧美va| 日韩免费高清av| 亚洲欧美激情小说另类| 国产夫妻精品视频| 亚洲三级电影网站| 欧美日韩大陆在线| 国产精品天美传媒| 精品午夜久久福利影院 | 精品国产污网站| 亚洲一区在线看| 成年人国产精品| 亚洲一区二区三区四区在线| 欧美精品v国产精品v日韩精品| 国产精品久久久久久妇女6080| 紧缚捆绑精品一区二区| 国产精品不卡一区| 欧美老女人第四色| 中文字幕一区视频| 国产精品一区二区三区乱码| 椎名由奈av一区二区三区| 欧美年轻男男videosbes| 国产精品福利影院| 国产麻豆欧美日韩一区| 亚洲欧美另类小说| 欧美一二三在线| 亚洲综合丝袜美腿| 2023国产精品| 免费成人在线影院| 欧美国产欧美亚州国产日韩mv天天看完整 | 欧美在线免费观看亚洲| 国产女人18毛片水真多成人如厕 | 国产色产综合色产在线视频| 麻豆精品在线播放| 国产精品高潮呻吟| 欧美一区二区视频观看视频| 亚洲图片欧美一区| 久久亚洲一区二区三区四区| 久久99国产精品久久99果冻传媒|