【Dify】Lesson6-2:ボイスメモ自動要約アプリを作ろう

音声メモって、録った瞬間は「あとで見返そう」と思うのに、いざ読み返すとなると時間がかかって放置しがちです。
そこでこの記事では、Difyで「ボイスメモ自動要約アプリ」を作り、音声ファイルをアップロードするだけで内容を短く要約し、記録として残せる形にしていきます。
今回作るのは、“音声 → 文字起こし → 要約 → Googleスプレッドシートに保存 ”の流れをワークフローでつなげたアプリです。
「ボイスメモを録る習慣はあるけど、整理が追いつかない」「要点だけを素早く残して、後で活用したい」——そんな人に刺さるアプリなので、副業用の小さな自動化アプリの題材としても相性が良いです。

ここまでのレッスンを順番に記事を読んできた人は、まだGoogleスプレッドシートのプラグインを入れてないはず。
その場合は先に Column6-3:Googleスプレッドシート連携入門 の記事で導入してからまたここに戻ってきてね!

Lesson1:Dify入門|環境構築と最初の生成AIアプリ開発
Lesson2:まずは体験|基本的なアプリを4つ作ろう
Lesson3:文章業務の自動化|実務で使えるアプリを開発しよう
Lesson4:ファイル処理で広がるDifyアプリ開発
Lesson5:RAG実践|ナレッジ検索アプリを作ろう
Lesson6:機能拡張と外部システム連携|ツールを使いこなそう
・Lesson6-1:ツールとプラグインの違いと使い方
・Lesson6-2:ボイスメモ自動要約アプリを作ろう ◁今回はここ
・Lesson6-3:名刺QR作成アプリを作ろう
Lesson7:総仕上げ|準備を整えて生成AIアプリ開発者へ
ボイスメモ自動要約アプリの概要・できること
この「ボイスメモ自動要約アプリ」は、音声ファイルをアップロードすると、内容を短い要約にまとめて、Googleスプレッドシートへ記録してくれるアプリです。
“録るのは簡単だけど、振り返りが面倒”になりがちなボイスメモを、「後で使える情報」に変えるのが目的です。

処理フロー:音声アップロード→文字起こし→要約→スプレッドシート記録
処理の流れはとてもシンプルで、ユーザーがやることは「音声ファイルを渡す」だけです。
アプリ側では次の順番で自動処理が走ります。
- 音声ファイルを受け取る
- 音声を文字起こしする(Speech to Text)
- 文字起こし結果を要約する(LLM)
- 「日時」と「要約」をスプレッドシートへ書き込む
“文字起こしまで”で終わらず、最後に「蓄積する」ところまで一気通貫で作るところがポイントです。
Googleスプレッドシートに「日時+要約」を残せる
要約結果は、Googleスプレッドシートに「記録」として残ります。
今回は、現在時刻を取得して要約とセットにし、指定したシート・セル範囲へ書き込みます。
google_sheetsのプラグインをまだ入れていない場合は、↓↓の記事を参考にして先に導入しておきましょう。

それでは、実際に「ボイスメモ自動要約アプリ」を開発していきましょう。
ここから先は会員向けの限定テキストになります。
当サイトの概要や特徴、無料で読める範囲 等は Dify学習館のトップページ をご確認ください。


すでに購入済みの方はこちら


