這篇解決什麼問題? 很多人把 Gemini 當成「另一個聊天機器人」,只丟一句問題就期待好結果,白白浪費了它最強的兩個能力:原生多模態與深度整合 Google 生態。這篇文章適合誰讀? 行銷、客服、營運與企業 IT 導入負責人——只要你的工作每天要處理圖片、PDF、試算表、Gmail 與簡報,就值得看。讀完你會得到什麼? 一套可直接複製的 Gemini Prompt 範本、一張 Workflow 流程圖,以及把繁瑣作業時間砍半的具體方法。
為什麼要重新學 Gemini 的 Prompt?
大多數 Prompt 教學都是繞著純文字對話打轉,但 Gemini 的設計重點從一開始就不只是文字。它有兩個關鍵差異,會直接改變你下指令的方式:
第一,原生多模態。Gemini 不是「先把圖片轉成文字再處理」,而是同時理解文字、圖片、PDF、表格甚至影片畫面。這代表你可以把一張產品照、一份報價 PDF、一份客戶回饋試算表一起丟給它,要它做跨來源的綜合判斷。如果你想更系統地理解「模型同時看圖讀字」這件事的運作邏輯,建議先讀 多模態 AI 應用指南,再回來看怎麼把它變成可操作的指令。
第二,超長上下文與 Google 生態整合。Gemini 能一次吃下整份合約、整本產品手冊;在 Google Workspace 裡,它還能直接讀你的 Gmail、Docs 與試算表。對台灣中小企業來說,這意味著不必再導入複雜系統,只要把 Prompt 寫好,現有的 Google 帳號就是你的自動化平台。
要強調一個常被忽略的觀念:Prompt 寫法的核心原則跨模型相通,差異在於各家模型的「強項區」。ChatGPT 擅長對話式推理與外掛生態,Claude 擅長長文與嚴謹結構,Gemini 則在多模態與 Google 整合上佔優。與其每換一個工具就重學一次,不如先掌握共通骨架,再針對 Gemini 的強項加碼。想做跨模型對照,可同時參考 ChatGPT Prompt 教學 與 Claude Prompt 教學,你會發現三者的「結構化思維」高度一致。
核心概念:把 Gemini 當成有眼睛的分析師
與其把 Gemini 想成聊天機器人,不如把它想成一位同時有眼睛、會讀檔案、又坐在你 Google 帳號旁邊的分析師。你給這位分析師的指令越清楚、素材越完整,他的產出就越接近交付品質。
下面這張表整理了「隨便問」和「結構化指令」的差別:
| 面向 | 隨便丟一句 | 結構化 Gemini Prompt |
|---|---|---|
| 角色 | 沒指定,回答發散 | 「你是資深電商文案」精準定位 |
| 素材 | 純文字描述 | 直接附圖片/PDF/試算表 |
| 格式 | 自由發揮 | 指定表格、JSON 或固定欄位 |
| 限制 | 無 | 字數、語氣、禁用詞、事實來源 |
| 驗收 | 看了再說 | 要求自我檢查+標註不確定處 |
掌握這張表,就掌握了 Gemini Prompt 的精髓:角色 → 素材 → 格式 → 限制 → 驗收,五個環節缺一不可。這套骨架其實就是業界常見框架(RTF、CRISPE)的精簡版,如果你想把它擴成更完整、可套不同任務的模板,Prompt 工程框架 有更細的拆解。
實際教學
Step 1:開頭就鎖定角色與輸出格式
不要問「幫我寫產品介紹」,而要說「你是專攻台灣母嬰市場的資深電商文案,請用條列+一段總結的格式,輸出 3 個版本」。角色與格式越前面講越好,Gemini 會用它來決定整段回答的語氣與結構。若你是在團隊裡反覆使用同一個角色設定,更建議把角色寫進系統層,做法見 System Prompt 教學。
Step 2:一次餵入多模態素材
這是 Gemini 最被低估的能力。把產品照片、競品報價 PDF、客服 Excel 一起上傳,然後下指令:「比對這三份資料,找出我們的價格與賣點差異」。你不需要先自己整理,讓它做跨來源整合,這正是純文字模型做不到的。重點是在文字裡逐一點名每個素材的用途,否則模型可能略過某張圖。
Step 3:給範例與硬性限制
提供 1-2 個你滿意的輸出範例(few-shot),並明確寫出限制:字數上限、必須用台灣用語、禁止出現「優惠」以外的促銷詞、不確定的數據要標註。範例比形容詞有用十倍——與其說「寫得專業一點」,不如貼一段你心中的好範本。這個「給示範」的技巧威力很大,獨立成篇的 Few-shot 範例教學 解釋了為什麼 2-3 個好範例往往勝過一大段抽象描述。
Step 4:串接 Google 生態
在 Google Workspace 的 Docs 或 Gmail 側邊欄打開 Gemini,直接下指令:「總結這封信串的待辦事項,列成表格」或「根據這份試算表的 Q2 數據,幫我寫一段給主管的摘要」。它讀的是你有權限的即時資料,省去複製貼上。想把這一步自動化成固定流程、套用別人驗證過的範本,可到 任務食譜書 找對應的工作流程。
Step 5:迭代與驗收
第一版幾乎不會完美。用追問修正:「第二版太正式,改口語一點」「把第 3 點的數字來源標出來」。最後加一句驗收指令:「請檢查以上內容有沒有與我提供的檔案矛盾,列出不確定的地方」,讓它自我審查再交付。這個收尾動作能擋掉大部分幻覺。
進階:更深入的一層
掌握五步骤後,多數人會卡在同一個地方:任務一複雜,單一 Prompt 就開始失控。這一節談三個能讓你從「會用」進階到「用得穩」的關鍵手法。
一、把長上下文當「工作記憶」而非「垃圾桶」。 Gemini 能吃下整本手冊不代表你該把所有東西一股腦塞進去。模型對「上下文中段」的注意力通常弱於開頭與結尾(俗稱 lost in the middle)。實務做法是:把最關鍵的指令與最重要的素材放在 Prompt 的最前面或最後面,中段放參考資料,並在結尾重述一次任務目標。對於超長 PDF,先請它「先做一份分頁重點索引」,再針對需要的頁碼追問,效果遠勝一次要它讀完並回答。
二、用「思考步驟外顯」逼出推理品質。 面對需要比對、計算、分類的任務,在 Prompt 加一句「請先一步步列出你的分析過程,再給結論」,會明顯提升正確率。這也方便你檢查它哪一步推錯。若任務涉及多模態比對(看圖+讀表),更要求它「逐張圖、逐欄位說明依據」。
三、區分「事實型」與「創意型」任務,給不同的限制。 事實型(如財報摘要、合約條款抽取)要把溫度壓低、強制「資料中沒有就標註待確認」;創意型(如廣告標題、貼文)才放寬語氣、要它一次多給幾個版本。把這兩類任務混在同一段 Prompt,產出往往兩頭不到位。
下表整理三家主流模型在實務任務上的取向差異,幫你決定「哪一步該交給 Gemini」:
| 情境 | Gemini | ChatGPT | Claude |
|---|---|---|---|
| 一次讀多張圖+表格做比對 | 強項,原生多模態 | 可用 | 可用 |
| 直接讀 Gmail/Docs/Sheets | 強項,Workspace 原生 | 需外掛 | 需外掛 |
| 超長合約/手冊全文理解 | 強項,長上下文 | 中等 | 強項 |
| 嚴謹長文與結構化輸出 | 中上 | 中上 | 強項 |
| 對話式逐步推理與外掛 | 中上 | 強項 | 中上 |
結論很清楚:多模態與 Google 整合的環節交給 Gemini,其餘步驟視情況分工。這種「依強項分配任務」的做法,本身就是 Prompt 工程框架 強調的設計思維。
範例:Prompt 與 Workflow
下面是一個可直接複製的多模態 Gemini Prompt 範本,用於「看圖+讀數據,產出電商商品文案」:
# 角色
你是專攻台灣電商的資深商品文案,熟悉蝦皮與官網的轉換寫法。
# 任務
我已上傳:
1. 一張產品主圖
2. 一份競品價格 PDF
3. 一份過去客戶評論的試算表
請依下列步驟產出(每一步先列出依據再給結論):
(1) 從圖片描述產品的 3 個視覺賣點
(2) 對照 PDF,指出我們相對競品的價格優勢一句話
(3) 從評論試算表萃取顧客最常提到的 2 個好處
(4) 綜合以上,寫出 3 個版本的商品標題(各 ≤ 28 字)與一段 100 字內文
# 限制
- 全程繁體中文台灣用語,禁用簡體與中國慣用詞
- 不得編造規格;資料中沒有的數據標註「待確認」
- 語氣親切但不浮誇,禁用「全網最低」等誇大字眼
# 驗收
最後檢查產出是否與我提供的三份檔案一致,列出任何不確定處。
如果你想把這個範本「角色」抽出來、變成整個對話都生效的設定,可改寫成系統層指令,做法見 System Prompt 教學;想一次生成多個變體範本,則交給 Prompt 產生器。
對應的自動化 Workflow,可以這樣串起來(文字版流程圖):
收集素材(產品圖+競品 PDF+評論表)
↓
上傳至 Gemini 並送出多模態 Prompt
↓
Gemini 跨來源分析,逐步列依據後產出 3 版文案草稿
↓
編輯人工挑版+微調(追問迭代)
↓
Gemini 自我驗收事實一致性,標註待確認項
↓
定稿回填至 Google Docs/上架後台
想把這類流程接成可重複套用的標準作業,任務食譜書 裡有現成的多模態工作流可以照抄。
常見錯誤
- 把多模態當成裝飾:只上傳圖片卻沒在 Prompt 裡明確要它「分析圖片」,Gemini 可能略過。一定要用文字點名素材,圖像描述的細節寫法見 AI 生圖 Prompt 教學。
- 一次問太多又沒結構:把十件事塞進一句話,回答會雜亂。改用編號步驟拆解任務。
- 把關鍵指令埋在超長上下文中段:模型容易在中段失焦,重要指令請放開頭或結尾並重述一次。
- 不給範例只給形容詞:「寫得有質感一點」這種指令幾乎無效,貼一個範本比形容詞精準得多。
- 完全相信輸出不複核:Gemini 仍會產生幻覺,財務、法律、醫療相關內容務必人工查證。
- 忽略台灣用語:不加限制時模型容易冒出「視頻」「質量」「信息」等中國慣用詞,要在 Prompt 明確禁止。
最佳實務
- 角色與格式放最前面:開頭就定錨,後續回答品質明顯提升。
- 善用長上下文但別塞滿:一次餵入完整資料讓它通盤理解,但把最重要的指令放頭尾。
- 多模態要明確點名:清楚說「根據第 2 張圖」「依這份 PDF 第 3 頁」。
- 要求外顯推理:複雜任務加一句「先列分析過程再給結論」,正確率與可檢查性都上升。
- 建立可重複的 Prompt 範本:把成功的指令存成模板,讓全團隊共用,可搭配 Prompt 產生器 快速產出。
- 加上自我驗收環節:每個重要產出都要求 Gemini 自查事實與格式。
- 在 Workspace 內整合:能直接讀 Google 檔案就不要複製貼上,減少出錯。
實際案例:台中某電商品牌的商品上架流程
一家台中經營母嬰用品的電商團隊,過去每上架一支新品,要由一位編輯手動比對競品價格、翻評論、寫文案,整套流程耗時且容易遺漏。
導入前:
- 每支商品文案製作約需 6 小時(找競品、讀評論、寫稿、校對)
- 每週只能上架約 8 支新品
- 文案常出現中國慣用詞,需主管二次校對
導入後(採用上述多模態 Gemini Prompt 範本+Google Workspace 流程):
- 每支商品文案製作降到約 2.5 小時,時間省下約 58%
- 每週上架量提升到約 18 支
- 在 Prompt 內鎖定台灣用語後,二次校對需求下降約 70%
關鍵不在「用了 Gemini」,而在於團隊把多模態素材整合與結構化指令+驗收環節標準化成可重複的範本。
第二個案例:台北 B2B 客服信件分流
另一個值得參考的情境,是台北一家做工業設備的 B2B 公司。他們的客服信箱每天湧入上百封詢價、報修與規格詢問信,過去靠一位專員逐封分類、轉派給對應業務,平均每封處理約 4 分鐘,且常因人力波動而積壓。
導入做法很單純:在 Gmail 側邊欄用 Gemini,搭配一段固定的系統層指令,要它「讀取信件內容與附件 PDF,判斷類別(詢價/報修/規格/其他)、抽取客戶公司與聯絡人、給出建議轉派對象,輸出成固定欄位表格」。因為涉及機密客戶資料,他們特別在系統指令裡鎖定「只依信件內容判斷、不得臆測、敏感資訊不外流」,這套邊界寫法正是 System Prompt 教學 的核心。
成效:
| 指標 | 導入前 | 導入後 |
|---|---|---|
| 每封信平均處理時間 | 約 4 分鐘 | 約 1 分鐘 |
| 分類正確率 | 人工約 90% | 模型初判約 92%,人工只需抽查 |
| 尖峰積壓 | 常見 | 大幅緩解 |
這個案例的啟示是:Gemini 在 Google 生態裡的最大價值,往往不是「寫得多漂亮」,而是把原本卡在人力的分流與整理環節自動化。想把這類流程模組化、串成完整管線,可到 任務食譜書 取用現成範本。
免責聲明:本文涉及財務、法律與醫療等內容僅供流程示範,不構成投資、法律或醫療建議,實際應用請諮詢專業人士並人工複核。
結論
Gemini 的價值不在於「會聊天」,而在於它能同時看圖、讀檔、串接你既有的 Google 工作環境。只要把指令寫成「角色 → 素材 → 格式 → 限制 → 驗收」五步結構,再善用多模態與長上下文、把關鍵指令放在頭尾、複雜任務要求外顯推理,就能把過去半天的作業壓縮到一兩小時。
下一步建議:先拿本文的 Prompt 範本套用到你最常做的一項重複工作,跑通後存成團隊模板。接著用 Prompt 工程框架 把這套結構擴成可套不同任務的模板,做 ChatGPT Prompt 教學 的跨模型對照找出各步該交給誰,最後到 任務食譜書 找現成流程直接套用。把 Prompt 寫對,現有的 Google 帳號就是你最低成本的 AI 自動化平台。
常見問題 FAQ
Gemini Prompt 和 ChatGPT 的寫法一樣嗎?
免費版 Gemini 可以用這些技巧嗎?
Gemini 能直接讀我的 Google 試算表嗎?
上傳機密檔案安全嗎?
為什麼 Gemini 有時會編造資訊?
多模態 Prompt 要怎麼寫圖片才不會被略過?
我想用同一套 Prompt 結構處理不同任務,有框架可循嗎?
Gemini 適合接進 AI Agent 工作流嗎?
延伸閱讀
每週把這類實戰教學寄給你
訂閱 AgentAI 智庫情報週報,新的 Prompt、AI Skills、工作流與教學第一時間收到。
免費 · 隨時取消