【Dify】Lesson2-3:チャットフローアプリの基本|文字抽出アプリを作ろう

今回はDifyの「チャットフローアプリ」を使って、画像をアップロードすると中の文字を抽出(OCR)して返してくれるアプリを作ります。
チャットフローは、ここまで体験してきたチャットボット、テキストジェネレーター、エージェントアプリとは少し作り方が異なります。
“部品をつないで会話の流れを作る” イメージで、会話の中に「処理の手順」や「条件分岐」を組み込んで、意図した流れで確実に動かせるのが強みです。

チャットボット、テキストジェネレーター、エージェントの3つは初心者向けの勉強用アプリと思っていいかな。
いよいよここからDifyの真骨頂に触れていくよ!
Lesson1:Dify入門|環境構築と最初の生成AIアプリ開発
Lesson2:まずは体験|基本的なアプリを4つ作ろう
・Lesson2-1:テキストジェネレーターアプリの基本
・Lesson2-2:エージェントアプリの基本
・Lesson2-3:チャットフローアプリの基本 ◁今回はここ
・Lesson2-4:ワークフローアプリの基本
・Lesson2-5:5つのアプリタイプの特徴と違いまとめ
・Lesson2-6:良いプロンプトの書き方
・実践課題:メール返信文ジェネレーターを作ろう
Lesson3:文章業務の自動化|実務で使えるアプリを開発しよう
Lesson4:ファイル処理で広がるDifyアプリ開発
Lesson5:RAG実践|ナレッジ検索アプリを作ろう
Lesson6:機能拡張と外部システム連携|ツールを使いこなそう
Lesson7:総仕上げ|準備を整えて生成AIアプリ開発者へ
Difyでチャットフローアプリを開発しよう
ここからは、Difyの「チャットフローアプリ」がどんな場面で役立つのか、そして中身がどんな仕組みで動いているのかを押さえていきます。
仕組みを先に理解しておくと、このあと作る「画像から文字を抽出する(OCR)アプリ」も、迷子にならずに組み立てられるようになります。

チャットフローアプリとは|できること・活用例
チャットフローアプリは、見た目はチャット形式ですが、裏側は「会話の流れに沿って処理を順番に進める」ように設計できるアプリタイプです。
チャットボットのように自然な会話を続けることもできますが、それ以上に強いのは「この入力が来たらこうする」「条件に合わないときは別の返答をする」といった、手順をコントロールできる点です。
たとえば、次のような “業務っぽい処理” と相性がいいです。
- ユーザーの入力をチェックして、不備があれば差し戻す(条件分岐)
- 入力内容を整形してからAIに渡す(前処理)
- 必要な情報だけを抜き出して、決まった形で返す(出力の整形)
- 「画像・テキスト・ファイル」など入力の種類に応じて処理を変える
- 社内の簡易ツールとして、問い合わせ対応や手順案内を半自動化する
つまりチャットフローは、「会話」+「処理手順」を組み合わせて、再現性の高いアプリを作りたいときに便利です。
副業でミニアプリを作る場合も、テンプレ化しやすいので扱いやすいジャンルです。
チャットフローの基本構造:ノードの流れと変数の考え方
チャットフローは、ざっくり言うと「ノード(部品)」を線でつないで、処理の流れを作っていく仕組みです。
各ノードには役割があり、入力を受け取る、AIに考えさせる、条件分岐する、結果をユーザーに返す…といった動きを担当します。

基本の流れは、次のイメージです。
- ユーザーがメッセージやファイル(画像など)を送る
- フローが入力を受け取り、必要ならチェックする(画像かどうか、空じゃないか など)
- 条件に応じて処理を分岐し、AI(LLM)やツールに渡す
- 生成された結果を整えて、チャット画面に返す
このとき大事なのが、「フローの途中で扱う情報は変数として保持できる」点です。
たとえば「ユーザーが送った画像」「抽出されたテキスト」「エラー時のメッセージ」などを変数として持っておき、後続のノードで使い回せます。
これができると、処理の見通しが一気によくなります。
それでは、実際にチャットフロータイプの「画像から文字を抽出するOCRアプリ」を作っていきましょう。
ここから先は会員向けの限定テキストになります。
当サイトの概要や特徴、無料で読める範囲 等は Dify学習館のトップページ をご確認ください。
すでに購入済みの方はこちら




