用 AI 自動處理文件:發票、合約、表單擷取的完整實作教學

財務小姐每天上班的第一件事,是把昨天收到的三十幾張供應商發票,一張一張看過、把廠商名稱、發票號碼、未稅、稅額、總計,手動敲進 Excel 再轉進會計系統。一張兩三分鐘,三十張就是一個半小時,而且敲到第二十張眼睛開始花,金額抄錯一個位數,月底對帳就要加班抓鬼。這不是哪一家公司的特例,這是台灣絕大多數中小企業每天都在重演的日常。

這篇要解決的問題:教你用 AI 把發票、合約、報價單、表單這些「非結構化文件」自動轉成「乾淨的結構化資料」,從選工具、寫擷取指令到設覆核機制,做到可上線、不出包。 適合誰讀:財會、行政、採購、人資、法務助理——任何每天要從一堆文件裡抄資料進系統的人,沒有技術背景也跟得上。 讀完你會得到:一套文件自動化的完整心法、一張工具選擇對照表、五個實作步驟、可直接複製的擷取 Prompt、一個台灣貿易公司導入前後的真實數據對照,以及最容易出包的錯誤清單。

TL;DR:把文件自動化做成功的關鍵,不是「找一個最強的 AI 一鍵全包」,而是「先 OCR 再理解、用 JSON 定義欄位、加信心分數讓人工只覆核少數件」。先用無程式方式驗證 Prompt 準確率,再串系統,自動化率可達八成以上而錯誤被擋在進帳之前。

免責聲明:本文涉及的會計、稅務與合約欄位擷取為流程教學示範,AI 擷取結果可能出錯;正式記帳、報稅與合約簽署前,務必由具會計師、稅務或法務專業者覆核原始文件。

為什麼「文件處理」特別值得用 AI

很多老闆對 AI 的想像停在「寫文案、做圖」,卻忽略了 AI 最能立刻省錢的場景,其實是這種沒人想做、又不得不做的文件搬運工作。原因有三個。

第一,它是純粹的重複勞動,價值低但量大。把發票金額抄進系統不需要創意、不需要判斷,卻每天都要做、做不完。這種工作交給人,是用昂貴的時間做廉價的事;交給 AI,剛好物盡其用。

第二,人工出錯率高且難察覺。連續敲三十張發票,少打一個零、把 6 看成 8,這種錯不會當下跳出來,要等月底對帳對不上才爆。AI 不會疲勞,再加上自動的交叉驗證規則,反而比人更不容易讓金額錯誤溜進系統。

第三,過去做不到,現在才做得到。十年前要自動讀發票,得為每一種版型刻一套模板,廠商一改版就壞,維護成本高到只有大企業玩得起。現在的多模態 AI 是「理解」文件內容而非「比對」固定位置,所以它能容忍版型變化,中小企業也負擔得起。這是這兩年才真正成熟的能力,值得重新評估。

換句話說,文件自動化是 AI 投資報酬率最高、最容易看到成果的起手式。你不需要先有宏大的數位轉型藍圖,光是把「抄發票」這一件事自動化,就能立刻釋放出一個人力。

核心概念:從「非結構化」到「結構化」

要理解這件事,先搞懂一個關鍵詞:非結構化資料。一張發票對人來說一目了然,但對電腦來說,它只是一堆像素或一段沒有欄位標記的文字——電腦不知道哪個數字是「總計」、哪串文字是「統一編號」。文件自動化的本質,就是把這種「人看得懂、電腦看不懂」的東西,翻譯成「電腦能直接存進資料庫」的結構化資料。

這個翻譯過程分成兩層能力,很多人會混淆,務必分清楚:

能力它做什麼像什麼代表工具
OCR(光學辨識)把影像上的文字「認」出來變成可選取的文字與座標把照片裡的字打成逐字稿Google Document AI、Azure Document Intelligence、AWS Textract
語意理解/擷取從文字裡判斷「哪段是發票號碼、哪個是稅額」看懂逐字稿並填進表格GPT、Claude、Gemini 等多模態大型語言模型

關鍵心法是:清晰的數位 PDF 或截圖,可以直接丟給多模態 AI 一步到位;但掃描檔、手寫、傾斜、低解析度的影像,要先過 OCR 再交給 AI 理解,準確率會高很多。 不要因為多模態模型「也能看圖」就全部直接丟圖,遇到爛掃描檔它一樣會猜錯。先 OCR 再理解,是專業做法與玩票做法的分水嶺。

下表幫你快速判斷不同文件該怎麼處理:

文件類型常見挑戰建議做法
數位發票/電子報價單(PDF)通常清晰、欄位固定多模態 AI 直接擷取
掃描紙本發票歪斜、模糊、蓋章遮字先 OCR 校正再交 AI
手寫表單/簽收單字跡潦草專業手寫 OCR +人工覆核高比例
多頁合約條款散落、跨頁切段+指定要抓的條款清單
跨欄表格(對帳單)欄位對齊困難用能輸出座標的 OCR 保留表格結構

實際做法:五步打造可上線的文件自動化

Step 1:盤點文件類型與欄位清單

不要一開始就想「把所有文件都自動化」。先挑一種量最大、最痛的文件(通常是進項發票),列出你每次要從它身上抄哪些欄位。這份「欄位清單」就是 AI 擷取的標準答案,也是你日後驗收準確率的依據。

以進項發票為例,欄位清單可能是:供應商名稱、統一編號、發票號碼、開立日期、未稅金額、稅額、含稅總計、品項明細。把它寫清楚,後面每一步都會用到。

Step 2:選對工具——OCR 還是多模態

依照前面的對照表,判斷你的文件主要是哪一種品質。數位 PDF 為主,就用 ChatGPT、Claude 這類能讀檔的多模態工具起步;掃描與手寫多,就先接一個專業 OCR。不確定時,最快的驗證法是各拿五份真實文件,分別用兩種路徑跑一次,比對哪個準。延伸的工具選擇可參考最佳 AI 自動化工具盤點

Step 3:寫結構化擷取 Prompt

這是整套流程的心臟。重點是不要讓 AI 用一段文字回答你,要它回傳機器讀得懂的 JSON。Prompt 裡要把欄位、型別、規則全部寫死(找不到填 null、金額去逗號與貨幣符號、日期統一成 YYYY-MM-DD)。完整範例見下一節。

Step 4:設信心分數與人工覆核

這一步決定你敢不敢把它上線。要求 AI 對每個關鍵欄位額外輸出一個信心分數,再加上業務邏輯驗證規則(未稅+稅額是否等於總計)。把「低信心」或「驗證對不上」的件數自動標記出來退給人工,其餘自動放行。這就是所謂的 human-in-the-loop(人在迴圈中)——你不是要 100% 全自動,而是要 80% 自動+20% 聚焦覆核,整體又快又不出包。

Step 5:串接系統與歸檔

最後把擷取出來的 JSON 寫進 Excel、Google Sheet 或會計/ERP 系統,原始檔依「日期_供應商_發票號碼」之類的規則自動改名歸檔。小量手動貼即可;要每天自動跑,就用 Make、n8n 把「收信附件→OCR→AI 擷取→寫表→歸檔」串成一條 Workflow,整套流程設計可參考 AI Workflow 設計教學,現成範本到 /workflows 直接套用。

可複製的擷取 Prompt

把下面這段貼進 ChatGPT 或 Claude,連同發票檔案一起送出。實務上請依你 Step 1 的欄位清單增刪欄位。

你是專業的財會文件擷取助理。我會提供一張發票(圖片或 PDF)。
請只輸出 JSON,不要任何其他文字或說明。

擷取規則:
1. 嚴格依照下方欄位結構輸出,欄位順序不可更動。
2. 任何欄位若文件中找不到,一律填 null,不要省略該欄位、不要猜測。
3. 金額一律輸出純數字,去除逗號、貨幣符號與空白;日期統一為 YYYY-MM-DD。
4. 每個關鍵欄位附一個 confidence(high / medium / low),表示你對該值的把握。
5. 額外做一個交叉驗證:判斷 untaxed + tax 是否等於 total,
   結果填入 validation.amount_check(true / false / null)。

輸出格式:
{
  "supplier_name": "",
  "tax_id": "",
  "invoice_number": "",
  "invoice_date": "",
  "untaxed": 0,
  "tax": 0,
  "total": 0,
  "line_items": [
    { "description": "", "qty": 0, "unit_price": 0, "amount": 0 }
  ],
  "confidence": {
    "tax_id": "high",
    "invoice_number": "high",
    "total": "high"
  },
  "validation": { "amount_check": true },
  "needs_human_review": false
}

最後依規則自行判斷:若任一關鍵欄位 confidence 為 low、
或 validation.amount_check 為 false,請把 needs_human_review 設為 true。

這段 Prompt 的設計重點有三個:強制 JSON 讓下游程式好接、強制保留 null 欄位避免漏抓、內建信心與驗證讓系統知道哪些要退人工。要處理合約或其他文件時,把欄位換成你的清單即可,合約條款擷取的進階技巧見 AI 合約審閱教學

台灣中小企業實作案例:一家貿易公司的進項發票自動化

公司背景:台中一家做五金零件進出口的貿易公司,二十多人,每月要處理約 600 張進項發票,來自上百家國內外供應商,版型五花八門。原本由一位行政人員負責 key-in 進會計系統。

導入前的痛點

導入做法:先用本文 Step 1 到 Step 4 的方法,拿 50 張真實發票在 Claude 上手動測 Prompt,把準確率調到滿意。確認可行後,用 n8n 串成自動流程:供應商寄來的發票附件進信箱→自動過 OCR→送 AI 擷取→低信心或驗證失敗的退到一個「待覆核」清單、其餘直接寫進 Google Sheet 並轉入會計系統→原始檔自動歸檔。整套花了約兩週建置,類似的登打自動化思路見 AI 資料登打自動化

導入後成果(上線三個月後統計)

指標導入前導入後
每月人工處理工時約 50 小時約 11 小時(僅覆核退件)
自動放行比例0%約 82%
月底對帳加班6–8 小時近乎零
金額錯誤進系統偶發、難追被驗證規則攔下
發票處理週期1–3 天當日完成

關鍵心得:負責導入的會計主管說,最有價值的不是「全自動」,而是「AI 先把八成做掉、把對不上的兩成清楚標出來,人只要看那兩成」。行政人員從每天抄兩個半小時,變成每天花二十分鐘檢查退件,省下的時間拿去做應收帳款追蹤,整個財務流程都鬆了下來。這套思路同樣適用於會計事務所的 AI 應用

常見錯誤:八成的人都踩過

錯誤一:追求 100% 全自動,結果一個出包就全盤不信。 文件自動化的正確目標是「高自動化率+低風險」,不是「零人工」。沒有覆核機制的全自動,遲早因一次錯帳被老闆叫停。先求穩,再慢慢提高自動放行門檻。

錯誤二:爛掃描檔直接丟多模態模型。 看到模型「能讀圖」就全部丟圖,遇到歪斜模糊的掃描件辨識率直接崩。記得分流:清晰的直接讀,爛的先過 OCR。

錯誤三:讓 AI 用自然語言回答,下游無法自動處理。 「這張發票總計是 12,600 元」這種回答程式接不住。一律要求結構化 JSON,並把欄位、型別、缺值規則寫死。

錯誤四:沒有交叉驗證,錯了也不知道。 只擷取不驗證,等於把 AI 的猜測當成真理。一定要加業務邏輯檢查(未稅+稅=總計、品項加總=小計),讓系統自己抓出可疑件。

錯誤五:把高機密文件丟進公開版聊天工具。 合約、人事、客戶個資不該丟進可能拿去訓練的公開服務。改用 API 方案、確認資料不留存條款,並在送出前遮蔽敏感欄位。

錯誤六:一次想吃下所有文件類型。 同時自動化發票、合約、報價單、簽收單,每種都做不深、都不上線。先把量最大那一種做到能上線,嘗到甜頭再擴張。

結論

用 AI 自動處理文件,是中小企業導入 AI 投資報酬率最高、最快見效的一步。它不需要宏大的轉型計畫,只要挑出「抄發票」這種量大、低價值、又出錯率高的工作,用「先 OCR 再理解、JSON 定義欄位、信心分數讓人工只覆核少數件」這套方法,兩週內就能讓一個人力從重複勞動裡解放出來。

記住三個原則:目標是「可控的高自動化」而非「魯莽的全自動」、永遠用結構化輸出加交叉驗證、敏感文件要顧好資安。先用無程式方式把 Prompt 的準確率調好,再決定要不要串系統,你就能把每天那一個半小時的抄寫,變成每天二十分鐘的安心覆核。

想把這套自動化擴展到其他流程,可以接著看 AI 文件自動化的批次與歸檔流程、用 自動化工作流範本 直接套用現成設計,或到 /tools 挑選適合你文件類型的工具。

常見問題 FAQ

AI 擷取發票會不會把金額看錯,害我做錯帳?
會有風險,所以重點不是『相信 AI』而是『設計覆核機制』。標準做法是要求 AI 對每個欄位輸出信心分數,並加上交叉驗證規則(例如未稅+稅額是否等於含稅總額、品項小計加總是否等於總計)。對不上的件數自動退給人工,對得上的才放行。這樣自動化率仍能到八成以上,錯帳風險卻被擋在進系統之前。
掃描品質很差或手寫的文件,AI 處理得了嗎?
純多模態模型對糊掉的掃描檔與手寫字辨識率會明顯下降。較穩的做法是先用專業 OCR(如 Google Document AI、Azure Document Intelligence、textract)把影像轉成文字與座標,再交給 AI 做欄位理解與結構化。先 OCR 再理解,比直接丟圖給模型穩定很多,尤其是手寫與低解析度文件。
我們文件有客戶資料與營業祕密,丟給 AI 會外洩嗎?
要看你用哪種服務。公開版聊天工具的資料可能被用於訓練,不適合放敏感文件。企業要用 API 方案或有資料不留存(zero retention)條款的服務,並在送出前做去識別化(遮蔽身分證、帳號)。合約、人事這類高機密文件,建議只擷取必要欄位、或評估可地端部署的開源模型。
做這套自動化需要會寫程式嗎?
看規模。十幾份的小量,用 ChatGPT 或 Claude 上傳檔案、貼擷取 Prompt 就能跑,零程式。要每天自動處理幾百份、還要寫進系統,就需要用 Make、n8n 這類自動化平台串接,或請工程師接 API。建議先用無程式方式驗證 Prompt 準不準,確認可行再投入串接。
合約這種長文件,AI 擷取條款可靠嗎?
合約擷取(金額、期間、違約金、自動續約條款)AI 能大幅加速初篩,但不能取代法務判斷。它適合做『把散落各頁的關鍵條款抓出來列成表』讓人快速比對,而非直接下『這份合約沒問題』的結論。重要條款一定要人工複看原文,AI 只是縮短你翻文件的時間。
一份文件要擷取的欄位很多,AI 容易漏抓怎麼辦?
把欄位清單寫死在 Prompt 裡,並要求 AI『就算找不到也要保留欄位並填 null』,避免它擅自省略。欄位太多時可拆成兩階段:先請 AI 判斷文件類型,再依類型套用對應的欄位模板。輸出用固定 JSON 結構,下游程式才好檢查哪個欄位是空的、需要補。
導入後維護麻煩嗎?廠商換了發票格式會不會整套壞掉?
用 AI 擷取的好處正是對版型變化的容忍度高——它理解的是『發票號碼長什麼樣』而非『發票號碼固定在第幾格』,所以廠商微調版面通常不會壞。真正要維護的是欄位清單與驗證規則:新增供應商、新增要抓的欄位時更新 Prompt 即可,不必像傳統樣板那樣重拉模板。
投入這套自動化,多久能回本?
取決於文件量。若一個月要人工 key-in 幾百份文件、每份平均 5 分鐘,一個月就是數十小時人力。導入後自動化率八成、人工只覆核兩成,省下的工時通常一到兩個月就能抵掉建置與 API 成本。文件量越大、越標準化,回本越快;量很小的反而不一定划算。

延伸閱讀

幫這篇打個分:
A
AgentAI 智庫團隊 ✓ 台灣實作團隊

我們是一群專注於 AI Agent、Prompt 與自動化工作流的台灣實作者。每篇教學都附可複製配方、誠實標示實測程度與限制,只分享真正能落地、可直接套用的方法——與其介紹工具,不如教你把事情做完。

關於我們 →看更多教學 →訂閱情報週報 →

每週把這類實戰教學寄給你

訂閱 AgentAI 智庫情報週報,新的 Prompt、AI Skills、工作流與教學第一時間收到。

免費 · 隨時取消