近年來,在“走出去”政策支持下,企業(yè)出海持續(xù)升溫。根據(jù)中國上市公司協(xié)會數(shù)據(jù),2024上半年我國上市公司實現(xiàn)海外業(yè)務(wù)收入3.83萬億元,同比增長12.84%。隨著出海規(guī)模不斷擴大,企業(yè)跨國間的交流也變得日益頻繁。為了應(yīng)對提交出口產(chǎn)品注冊資料、制作海外項目競標標書等場景,合合信息智能文檔處理技術(shù)助力企業(yè)解析、翻譯電子文檔,推進出海項目進程。
中企出海,應(yīng)對合規(guī)審查是第一關(guān)。企業(yè)需要處理的文檔不僅數(shù)量龐大,語種繁多,格式也不統(tǒng)一,包含多種結(jié)構(gòu)布局,尤其是無線表、密集表、合并單元格等復(fù)雜數(shù)據(jù),增加了信息提取難度。合合信息文檔解析技術(shù)是智能文檔處理技術(shù)流程中的關(guān)鍵步驟,能夠在還原版面的基礎(chǔ)上,理解、抽取多語種文檔內(nèi)文字、表格、公式、圖片等元素,為企業(yè)出海提升文檔處理效率。
文檔解析巧解醫(yī)療企業(yè)產(chǎn)品注冊難題
醫(yī)療器械是生物醫(yī)藥行業(yè)出海中的“主力軍”。醫(yī)械產(chǎn)品在上市前,不少海外國家都會要求企業(yè)在線填報醫(yī)療器械注冊申報表格,提供企業(yè)介紹、產(chǎn)品規(guī)格、設(shè)計文件、測試數(shù)據(jù)和臨床數(shù)據(jù)等信息,單人需要耗費數(shù)天進行資料的整理和翻譯。
合合信息文檔解析技術(shù)作為“全科優(yōu)秀生”,支持一個接口解析PDF、Word(doc、docx)、常見圖片(jpg、png、webp、tiff)、HTML 等多種文件格式,可一次性獲取文字、表格、標題層級、公式、手寫字符、圖片信息。同時還能夠做到按照人類閱讀的正常順序理解上下文關(guān)系,而非機械地從上到下讀取內(nèi)容。
以醫(yī)械產(chǎn)品說明書為例,文檔解析技術(shù)會根據(jù)版面布局合并在跨頁中被“攔腰斬斷”的段落和表格,接著再區(qū)分并提取純文本,表格內(nèi)的產(chǎn)品參數(shù)、型號、化學符號、數(shù)學單位等元素,保證數(shù)據(jù)解析結(jié)構(gòu)的完整性。
圖說:合合信息文檔解析技術(shù)精準實現(xiàn)跨頁段落合并
在完成文檔解析后,企業(yè)還需將內(nèi)容翻譯成當?shù)卣Z言版本用于醫(yī)械產(chǎn)品上市注冊審批,翻譯前的信息提取精度直接影響了翻譯精度。文檔解析技術(shù)能夠保持段落、表格等原始結(jié)構(gòu),減少翻譯后重排工作,同時支持批量、高效提取五十多種語言文檔內(nèi)的信息,可精確定位至某頁某行某個具體單詞,提升翻譯后的文檔一致性。
AI助力制造業(yè)規(guī)避侵權(quán)風險
制造業(yè)作為出海“老牌”行業(yè),正在向具有高附加值的先進制造業(yè)轉(zhuǎn)型,在此過程中,知識產(chǎn)權(quán)糾紛也成為了容易觸發(fā)爭議的領(lǐng)域之一?!吨袊鴮@{(diào)查報告》顯示,2023 年計算機、通信和其他電子設(shè)備制造業(yè)企業(yè)遭遇海外知識產(chǎn)權(quán)糾紛比例最高,影響企業(yè)海外發(fā)展前景。
對此,企業(yè)需要做好侵權(quán)風險分析,打造企業(yè)專利信息庫,定期檢索與本產(chǎn)品及技術(shù)密切相關(guān)的專利說明書、科研論文、國際標準等內(nèi)容。在專利庫搭建過程中,除了文本、表格和流程圖外,數(shù)學公式也是材料中常見的元素,以其復(fù)雜的結(jié)構(gòu)成為文檔解析過程中的“攔路虎”。
過去工作人員需要經(jīng)過數(shù)道繁雜程序?qū)竭M行查找、辨認和手工錄入,耗費時間長。文檔解析技術(shù)可單獨對公式類內(nèi)容進行批量提取,支持識別Latex公式并導(dǎo)出為MathML Code等多種格式。為了進一步提高數(shù)據(jù)精度,用戶可直接在界面上修改、編輯公式,方便后續(xù)數(shù)據(jù)應(yīng)用。
圖說:合合信息文檔解析技術(shù)批量識別公式
出海是中企尋求發(fā)展之道的重要路徑,然而藍海之下暗流涌動,企業(yè)出海仍面臨著市場、文化、法律等多方面的難題。合合信息會繼續(xù)挖掘智能文檔處理技術(shù)在出海場景中的深度應(yīng)用,幫助更多企業(yè)“揚帆遠航”。
免責聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點,亦不代表本網(wǎng)站贊同其觀點或證實其內(nèi)容的真實性。如稿件版權(quán)單位或個人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。
互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120230012 信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證0121673 增值電信業(yè)務(wù)經(jīng)營許可證京B2-20171219 廣播電視節(jié)目制作經(jīng)營許可證(京)字第10250號
關(guān)于我們 中宏網(wǎng)動態(tài) 廣告服務(wù) 中宏網(wǎng)版權(quán)所有 京ICP備2023030128號-1 舉報電話:010-63359623
Copyright ? 2016-2025 by www.uokii.com. all rights reserved 運營管理:國家發(fā)展和改革委員會宏觀經(jīng)濟雜志社