亮相VAlSE2023 合合信息智能文檔處理技術獲業(yè)內關注-環(huán)球熱訊

2023-06-16 20:57:41 來源：證券日報

(資料圖)

近日，2023年度視覺與學習青年學者研討會（Vision And Learning SEminar，VALSE）圓滿落幕。會議由中國人工智能學會、中國圖象圖形學學會主辦，江南大學和無錫國家高新技術產業(yè)開發(fā)區(qū)管理委員會承辦。超五千名專家學者、知名高校師生以及來自OPPO、華為、百度、合合信息等科技企業(yè)的研發(fā)人員齊聚大會，共探計算機視覺、圖像處理、模式識別與機器學習前沿技術的發(fā)展與應用。

VALSE是一個面向計算機視覺與機器學習領域國內外華人青年學者的高規(guī)格學術研討會，本屆會議專注于視覺知識和多重知識表達、語言文字識別與理解等技術研發(fā)及應用熱點。文檔的智能化處理是計算機視覺在產業(yè)中的重要應用方向，現(xiàn)階段還面臨著諸多挑戰(zhàn)。作為智能文檔處理領域的代表，合合信息出席會議并進行智能文檔處理技術研發(fā)與實踐成果分享。

合合信息相關技術人員提到，隨著OCR技術應用面的持續(xù)拓寬，復雜多變的版面、多樣化的文本內容給文檔的識別和還原帶來了新的挑戰(zhàn)?！鞍婷娣治雠c文檔還原”技術對提升文檔圖像電子化的視覺效果、信息提取精準度非常關鍵，是公司重點發(fā)力的方向之一。

文檔中通常含有大量的圖片、表格等非文字內容，一篇普通的論文或者文稿，除文字信息外，其版面往往包含頁眉、頁腳、表格、二維碼等多種元素。在向系統(tǒng)輸入文檔圖像后，機器會對文字部分和版面元素進行分析和識別，把若干行文字關聯(lián)起來，從而獲得正確的順序與段落關系，這便是版面分析技術。

版面分析的任務目標被分為物理版面分析和邏輯版面分析兩類，前者主要解決區(qū)域分割問題，后者則關注區(qū)域之間的邏輯關系或閱讀順序。如何精準地辨別各類元素，并在文檔電子化過程中讓它們回歸到應有的位置，是該項技術的難點之一。

如果無法提升版面分析的精準度，文件材料在被拍照、掃描成電子文檔的過程中便可能出現(xiàn)漏字、錯位的現(xiàn)象，圖片轉Word、圖片轉Excel等“可編輯”性的需求將無法被滿足。

“版面分析與文檔還原技術能夠幫助機器‘看懂’文檔結構，讓文檔電子化獲得‘所見即所得’的處理效果?！狈窒憝h(huán)節(jié)中，合合信息技術人員提到，文檔圖片的格式轉化流程中，在檢測、識別完出文字信息中的字符、坐標信息，以及版面中段落、印章、表格等元素信息后，機器才能“理解”文檔的組成，更好地將圖像“還原”成一個可編輯的Word或Excel文件。

據(jù)了解，合合信息版面分析技術通過解決版面分割、區(qū)域間的邏輯關系處理等方面的難題，可將文檔圖像切分成不同類型內容（文本、圖形、公式、表格等）的區(qū)域，并分析區(qū)域之間的關系，讓機器更精準地確定文檔中的文字位置、字體、大小和排版方式，從各類版式復雜的圖片文檔中精準獲取信息。

（文章來源：證券日報）

責任編輯：

免責聲明：以上內容為本網站轉自其它媒體，相關信息僅為傳遞更多信息之目的，不代表本網觀點，亦不代表本網站贊同其觀點或證實其內容的真實性。如稿件版權單位或個人不想在本網發(fā)布，可與本網聯(lián)系，本網視情況可立即將其撤除。

為您推薦

亮相VAlSE2023 合合信息智能文檔處理技術獲業(yè)內關注-環(huán)球熱訊
近日，2023年度視覺與學習青年學者研討會（VisionAndLearningSEminar，
焦點熱門:中國歷代皇帝中，竟有一位皇帝熱衷科學，不僅命人解剖還人造乳酪
中國歷代皇帝中，竟有一位皇帝熱衷科學，不僅命人解剖還人造乳酪,在我
天天短訊！大連機場口岸恢復越南芽莊客運航線
中新網大連6月16日電 (記者楊毅)15日19時，載有223名旅客的VJ515
網商貸欠錢不還怎么辦？會成黑戶嗎？|世界新要聞
隨著互聯(lián)網金融的發(fā)展，越來越多的人選擇網商貸款來解決資金問題。但是
楓香安徽黃山群體11家系_關于楓香安徽黃山群體11家系概略
1、楓香安徽黃山群體11家系是一種金縷梅科、楓香屬植物。文章到此就分
杭氧股份最新公告：擬注銷太原杭氧氣體有限公司
杭氧股份公告公司于2023年6月16日召開第七屆董事會第四十八次會議審議
南京六合區(qū)：人才區(qū)內買新房每平方米補貼300元，支持團購優(yōu)惠
南京六合區(qū)：人才區(qū)內買新房每平方米補貼300元，支持團購優(yōu)惠,房票,團
純電輕卡天花板江鈴樂行E路達全球首發(fā)重磅上市
6月15日，在上海舉辦的2023亞洲物流雙年展中，中國輕型商用車領導者的
環(huán)球熱訊:恒指漲1.07%收復2萬點關口基建股集體走強
中新經緯6月16日電16日，恒指高開高走。截至收盤，恒指漲1 07%報20040
又一進步！巴西棉花貿易或以人民幣結算【附棉花行業(yè)發(fā)展分析】
中國是世界上最大的棉花生產國之一，也是主要的棉花出口國之一。中國的
藥明康德：對今年全年指引和未來發(fā)展充滿信心
南方財經6月16日電，藥明康德在互動平臺表示，得益于CRDMO和CTDMO商業(yè)
天天熱推薦：張薇本科時期論文曝光，網友：就這論文水平，不保研哪也考不上
四川大學研究生張薇在地鐵污蔑大叔偷拍事件，成為了近期最大熱點事件之
312.19億元！佛山照明連續(xù)18年入選中國500最具價值品牌榜單全球熱點評
6月15日，由世界品牌實驗室(WorldBrandLab)主辦的(第二十屆)“世界品牌
炎炎夏日送清涼絲絲清涼暖人心
6月15日，中國十七冶集團有限公司江蘇分公司高新3號地項目部向施工人員
洪城環(huán)境：協(xié)議收購南昌水業(yè)集團南昌工貿有限公司100%股權每日快報
洪城環(huán)境（SH600461，收盤價：8 1元）6月16日晚間發(fā)布公告稱，為減少與
上海技術交易所與復旦管院達成科創(chuàng)企業(yè)上市培育庫運營戰(zhàn)略合作
據(jù)復旦管院消息，6月15日，上海技術交易所與復旦大學管理學院簽約，宣
今日高潮是哦寶貝寶貝寶貝男孩然后重復多次。這首歌叫什么名字|每日熱聞
1、babyjustinbieber唱的。本文到此結束，希望對大家有所幫助。
天天日報丨醫(yī)保飛檢為何“一查一個準”？飛檢系據(jù)線索進行調查
（人民日報健康客戶端記者?王振雅）重復收費、超標準收費、分解項目收
18家AI頭部企業(yè)、高校與科研機構聯(lián)合發(fā)布首個AI框架生態(tài)倡議|訊息
18家AI頭部企業(yè)、高校與科研機構聯(lián)合發(fā)布首個AI框架生態(tài)倡議,今日，人
熱文：整體搬遷！義烏市中心兩個菜市場公開招商！
注意注意義烏這兩個菜市場公開招商啦義烏市中心菜市場稠關菜市場
磐石農商銀行“春風行動”零距離助企紓困解難
為有效解決民營經濟融資難題，加大對縣域發(fā)展的金融支持力度，吉林磐石
安徽明天入梅！暴雨、大暴雨、雷暴大風來襲！-熱點評
圖116-19日全省逐日降水量預報過程累計雨量：沿淮淮河以南50～100毫米
警惕網絡賭球！天津10余人因網絡賭球被罰
企查查APP顯示，近期，天津市公安局紅橋分局針對多個參與網絡賭球人員
什么是廣告營銷_什么是廣告|快看
1、廣告，即廣而告知之意。2、廣告是為了某種特定的需要，通過一定形式
蜂助手（301382）：該股換手率大于8%（06-16）
摘要：2023年06月16日蜂助手（301382）換手率大于8%，主力資金凈流入81
B社托德：比起《無人深空》《星空》更像《荒野大鏢客2》
根據(jù)B社托德·霍華德（ToddHoward）的說法，《星空》的氛圍比起《無人
環(huán)球快資訊：電偶極子方向怎么判斷電偶極子
1、兩個相距很近的等量異號點電荷組成的系統(tǒng)。2、電偶極子的特征用電偶
北京康橋“藥谷一號”舉行升級改造揭幕儀式總建筑面積約12萬平
“藥谷一號”位于北京生物醫(yī)藥產業(yè)基地的中心地帶，總建筑面積約12萬平
當前視點！內容正在升級改造，請稍后再試！
內容正在升級改造，請稍后再試！【免責聲明】本文僅代表合作供稿方觀點
長春作為東北第一大都市，不是名義上的！
長春作為東北第一大都市，不是名義上的！“東北第一大都市”這個稱號，
腸癌多半是拖出來的！醫(yī)生：身體出現(xiàn)3種異常，最好去查一下腸鏡最新消息
女兒見狀不對帶著他去了醫(yī)院檢查，經檢查發(fā)現(xiàn)林大爺下腹部有明顯腫物，
濟南工程職業(yè)技術學院教務系統(tǒng)成績查詢（濟南工程職業(yè)技術學院教務服務平臺）-環(huán)球今頭條
來為大家解答以上的問題。濟南工程職業(yè)技術學院教務系統(tǒng)成績查詢，濟南
上頁是豎版下頁是橫版 word上頁豎版下頁橫版
1、word設置橫版和豎版同時存在，可通過插入分節(jié)符，單獨改變某一節(jié)的
精彩看點：兆訊傳媒、豪江智能等14只創(chuàng)業(yè)板股融資余額增幅超20%
據(jù)wind統(tǒng)計顯示，6月15日融資余額增長的創(chuàng)業(yè)板股有411只。其中，14股融
昆三中西山學校高中部揭牌今年計劃招300人_天天新動態(tài)
6月15日，昆明市第三中學西山學校舉行高中部揭牌儀式。2023年9月，昆三
董志龍_關于董志龍的簡介_快播報
1、董志龍，男，浙江東陽人，1966年8月28日出生，現(xiàn)任人民日報社中國經
南瓜的相克食物有哪些南瓜和什么食物有食用禁忌呢
1、南瓜的相克食物有菠菜、紅薯、羊肉、醋、蝦、紅棗。2、菠菜：南瓜里
薯片的危害_吃薯片有什么害處_全球時快訊
歡迎觀看本篇文章，小升來為大家解答以上問題。薯片的危害，吃薯片有什
建發(fā)股份主板再融資審核狀態(tài)更新為“已受理”
機會報從上海證券交易所網站獲悉，建發(fā)股份（600153）主板再融資（-2，
小林的谷明地鐵游記【3】：覺了！
列車從谷明鎮(zhèn)站開出之后，像有軌電車一樣在縣城的街道上緩慢行駛。轉過
最新消息：武漢大學人民醫(yī)院與恩施市中心醫(yī)院開展?？坡?lián)盟義診及授牌活動
6月14日上午，在恩施市芭蕉侗族鄉(xiāng)白果樹村，武漢大學人民醫(yī)院、恩施市
2023南昌城區(qū)義務教育入學房產認定時間要求_天天報道
2023南昌城區(qū)義務教育入學房產認定時間要求1、房產權證、拆遷協(xié)議及其
全球觀焦點：臨港新片區(qū)：將加快形成新型儲能等一批千億級產業(yè)集群
臨港新片區(qū)黨工委副書記吳曉華表示，未來三年，臨港新片區(qū)將以落實《行
【世界新要聞】068期黑天鵝雙色球預測獎號：藍球5碼參考
上期回顧：福彩雙色球第2023067期開出獎號：010312192832+14，紅球三區(qū)
曼朗新搜索營銷：營銷云時代下企業(yè)實現(xiàn)新增長的稱手工具
年初，中國傳媒大學與國家廣告研究院聯(lián)合發(fā)布報告，認為營銷云時代已經
滾動：總量穩(wěn)步增長，湖南省5月金融運行情況發(fā)布
總量穩(wěn)步增長，湖南省5月金融運行情況發(fā)布,存款,湖南省,本外幣,金融運
耳石復位方法每日頭條
您好，今天我將為大家介紹的主題是：耳石復位方法。耳石復位方法是一種
風險太大，不要去布局！-焦點訊息
照理說靴子落地了，市場應該有所表現(xiàn)，但是還是觀望狀態(tài)，這市場就有點
打造“無廢城市”，西安這樣做！_每日資訊
6月14日下午，西安市人民政府新聞辦舉辦西安市“無廢城市”建設情況新
每日頭條!足壇一夜三消息！魔笛創(chuàng)造歷史，英超新貴挖國米真核，盧卡庫蒙羞
在歐冠決賽結束之后，球迷終于又能夠欣賞到精彩的國家隊賽事，在這一個
全球觀察：氧化鋁期貨推出在即上市鋁企披露套保計劃
業(yè)界翹首以盼的氧化鋁期貨將于6月19日正式上市交易，記者注意到，近日
【天天報資訊】【我們的節(jié)日·端午】@金山人，端午將近，你會用什么材料來包粽子？
端午將近，不少人已經開始準備包粽子的各種材料。包粽子必不可少的原料
環(huán)球焦點！常州小升初搖號什么時候開始？
【2023年更新】(點擊對應的文字鏈接即可查詢詳情)2023常州民辦初中搖號
自媒體接單盈利平臺_自媒體接單-每日速讀
1、微信的接單平臺本身就不多，用得好的更沒幾個，最近新出的一個樂推
網購商品利用“七天無理由退貨”規(guī)則“薅羊毛” 商家希望對頻繁無理由退貨賬戶建立懲戒機制|全球快看點
調查動機前幾天，一網店店主發(fā)視頻吐槽稱：“電商太難做了，‘六一’兒
環(huán)球熱議:宜昌公交101路
1、宜昌公交101路所屬公司是宜昌公交集團有限責任公司，線路起止從夷陵

亮相VAlSE2023 合合信息智能文檔處理技術獲業(yè)內關注-環(huán)球熱訊

為您推薦

相關推薦

閱讀排行