【Dify】Lesson1-2:Difyを使う準備|環境構築とセットアップ

この記事では、Difyで生成AIアプリを作り始めるために必要な「準備」をまとめて終わらせます。
具体的には、Difyの利用形態(クラウド版/オンプレミス版)の違いを理解した上で、クラウド版の登録を進め、さらに生成AIを動かすための言語モデル設定(APIの基本を含む)まで到達するのがゴールです。
プログラミング経験がほとんどない方でも安心して進められるように、専門用語はできるだけ噛み砕いて説明します。
「まず何を選べばいいの?」「設定って難しそう…」と感じるところほど、丁寧に道筋を作っていきますね。
次のLesson1-3では、いよいよ最初のチャットボットを作ります。その前段階として、この記事で “アプリを動かす土台” をきちんと整えておきましょう。
Lesson1:Dify入門|環境構築と最初の生成AIアプリ開発
・Lesson1-1:生成AIアプリ開発の入り口|Difyとは何かを知ろう
・Lesson1-2:Difyを使う準備|環境構築とセットアップ ◁今回はここ
・Lesson1-3:Difyの入り口|初めてのチャットボットを作ろう
・Lesson1-4:RAG入門|ナレッジベースを作ろう
・Lesson1-5:作ったアプリを公開しよう|方法と注意点まとめ
Lesson2:まずは体験|基本的なアプリを作ろう
Lesson3:テキスト処理を行いアプリ開発
Lesson4:ファイル処理を行いアプリ開発
Lesson5:RAGアプリの開発
Lesson6:機能拡張と外部連携
Lesson7:AIエージェントを活用したアプリ開発
Lesson8:実務投入への総仕上げ
Difyはクラウド版とオンプレミス版がある|違いと選び方
Difyには大きく分けて2種類あります。
ブラウザですぐ使い始められる「クラウド版」と、自分(または会社)の環境にDifyをインストールして運用する「オンプレミス版」です。
どちらが正解、というよりも「目的と状況に合う方を選ぶ」のがポイントになります。
このサイトでは、基本的にクラウド版を使用します。
理由はシンプルで、初心者が最短でアプリ制作の体験に入れるからです。環境構築でつまずいて手が止まるより、まずは動くものを作って学ぶほうが上達が早いんですね。

オンプレミス版でも、操作はほとんど変わらないからどっちでも学習はできるよ。
クラウド版の特徴
クラウド版は、Dify側が用意しているサイトにログインして使う方法です。
パソコンに何かをインストールしなくても、アカウント登録さえすればすぐに開始できます。
たとえば、クラウド版には次のようなメリットがあります。ここを押さえておくと、選択に迷いにくくなります。
- すぐ始められる(環境構築がほぼ不要)
- アップデートや保守を意識しなくてよい
- 無料プランがあり、学習・試作・小規模運用に向いている
一方で、クラウド版では「データの置き場所」や「社内ルール(セキュリティ要件)」が気になる場合があります。
業務利用で厳格な規定がある会社では、事前に確認が必要です。
オンプレミス版の特徴
オンプレミス版は、自分のPCや社内サーバー、クラウドの自社管理環境などにDifyを構築して運用する方法です。
「データ管理を自分たちでコントロールしたい」というケースで選ばれます。
オンプレミス版が向いているのは、たとえば次のような状況です。
- 機密データを外部サービスに置けない(社内規定が厳しい)
- ネットワークやアクセス制限を細かく設計したい
- 自社の運用ルールに合わせて長期的に安定運用したい
ただし、オンプレミス版は導入と運用のハードルが上がります。
環境構築(Dockerなど)、アップデート対応、障害時の切り分けなど、ある程度のインフラ知識が必要になることが多いです。
学習を始めたばかりの段階では、ここで詰まってしまうのが一番もったいないポイントです。
初心者はどちらを選ぶべき?
このサイトはクラウド版を前提に進めていきます。理由は「無料で早く作って、早く学べる」からです。
オンプレミス版は、Difyに慣れて本格運用を開始するときからでも遅くありません。
まずはクラウド版で、アプリ制作の流れ・プロンプト設計・RAGの考え方など、成果に直結するスキルを身につけていきましょう。
クラウド版Difyの登録手順|アカウント作成〜初期画面まで
ここからは、クラウド版Difyに登録して、開発を始められる状態まで持っていきます。
クラウド版はブラウザだけで進められるので、環境構築に自信がない方でも取り組みやすいです。
1)Dify Cloudのログイン画面を開く
まずはDify Cloudのログイン画面にアクセスします。
画面には主に次のログイン方法が用意されています(時期によって表示が少し変わることがあります)。
- GitHubで続ける
- Googleで続ける
- メールアドレス+検証コードで続ける
どれを選んでも大丈夫ですが、学習用としては「普段使っているアカウントでサッと入れる方法」を選ぶのがおすすめです。
2)初回ログインでアカウントが作成される
クラウド版Difyは、初回ログイン時にアカウントが自動作成される仕組みです。
つまり「登録フォームに細かく入力する」タイプというより、ログイン=登録のようなイメージですね。
また、メールアドレスが同じであれば、GitHub・Google・メール認証など複数のログイン方法が紐づくことがあります。
また、プランは自動的にSandboxプラン(無料プラン)に設定されます。
本サイトでの学習はこのプランで十分です。学習後、本格的に運用する際には有料プランかオンプレミス版に切り替えましょう。
3)ワークスペースは自動で作られる|最初に見るべき場所
初回ログインができると、Dify Cloudではワークスペースが自動作成され、あなたがオーナー権限を持つ状態になります。

ここが「Difyで作業する単位」になります。
ワークスペースは「アプリやナレッジ、設定をまとめて管理する入れ物」くらいの理解でOKです。まずは次の2点だけ意識して画面を眺めてみてください。
- どこに「アプリを作る場所(Studioなど)」があるか
- どこに「設定(Settings)」があるか
この “画面の地図” ができると、次の章以降の作業が一気に楽になります。
4)ログインできないときのチェック(よくあるつまずき)
もしログインや登録でうまく進まない場合、たいていは原因が限られています。
落ち着いて次を確認してみてください。
- メール認証の場合、検証コードが迷惑メールに入っていないか
- GitHub/Googleの場合、別アカウントでログインしていないか
- 一時的なサーバー側エラーの可能性(時間をおいて再試行)
実際に、クラウド版で「Internal Server Error」が出てログインできないケースが報告されることもあります。
こういうときはあなたの設定ミスではない場合もあるので、焦らなくて大丈夫です。
言語モデルを使う仕組み|APIとAPIキーの取得
ここからは「API」「APIキー」「モデルプロバイダ」といった言葉が出てきます。
聞きなれない言葉ですが、Difyが “外部の生成AI” と会話するための「接続のルール」と「鍵」を理解できればOKです。
この章では、DifyがどうやってChatGPTのような言語モデルを動かしているのかを、できるだけイメージしやすく説明します。
ここを押さえておくと、次の「モデル設定」章がただの作業ではなく「意味のわかる設定」になります。
そもそも大規模言語モデル(LLM)って何?
大規模言語モデル(LLM)は、文章を理解して、文章を生成してくれる生成AIのことです。
チャットで質問に答えたり、文章を要約したり、アイデアを出したりできます。

ChatGPTはOpenAI社が開発しているLLMだね。
ここで重要なのは、DifyそのものはAIの頭脳を持っているわけではない、という点です。
Difyは「アプリを作る土台(UIやフロー、データ連携など)」を用意してくれていて、実際に文章を生成する “頭脳” 部分は外部の言語モデルにお願いする形になります。
APIとは何か|「注文の窓口」と考えるとわかりやすい
APIは、ざっくり言うと「外部サービスにお願いごとをするための窓口(ルール)」です。
たとえばレストランで、あなたが店員さんに「この料理ください」と伝えると、厨房が料理を作って持ってきてくれますよね。
これと同じで、Difyが言語モデルに「この質問に答えて」「この文章を要約して」とお願いするための “伝え方の決まり” がAPIです。
つまり、Difyが裏側でやっているのは次のような流れです。
- ユーザーが入力する
- Difyが入力を整える(プロンプトや設定を反映)
- APIを通して言語モデルに依頼する
- 言語モデルの返答を受け取る
- Difyが画面に表示する(必要なら加工する)
この仕組みが分かっていると、「なぜAPI設定が必要なのか」がスッと腑に落ちます。

本サイトでは ChatGPT API を使って、ChatGPTとDifyを繋ぐよ。
APIキーとは何か|「本人確認の鍵」だと思えばOK
APIキーは、APIを使うための “鍵” です。もう少し丁寧に言うと、「この依頼は誰が出しているのか」を識別するための情報です。
同じレストランの例でいうなら、APIキーは会員カードや予約番号のようなものです。
これがあるから、言語モデル提供側は「この人(この会社)の利用だね」と判断でき、利用状況に応じて料金計算や利用制限の適用ができます。
そのためAPIキーは、扱いを間違えると危険です。特に初心者のうちは、次の感覚だけ持っておけば十分です。
- APIキーはパスワードに近いもの
- 人に見せない/公開しない
- どこかに貼り付けるときは、画面共有やスクショにも注意する
OpenAIの API Keyを取得しよう
まずはOpen AIのログイン画面にアクセスします。
アカウントが必要となるので、持っていない方は「Sign up」を押して登録しましょう。
アカウントができたら、「+新しい秘密鍵を作成する」のボタンを押します。

必要な情報を入力しましょう。

- 所有者は「あなた」が基本。会社のお金で使用する場合は会社のルールに従ってください。
- 名前はこのキーの名前。空欄でも問題ありません。
- 権限は本サイトで学習するためには「全て」を選ぶ必要があります。
「秘密鍵を作成する」をクリックすると、あなた専用の秘密鍵が発行されます。
これは 必ずすぐにコピーして保存 してください。また誰かに悪用されないよう、流出に注意しましょう。
5ドル分のクレジットを購入しよう
APIキーが取得できたら、それを利用するためのクレジットを購入しましょう。
画面左下に「クレジットを追加」という枠が出ているので「請求へ」をクリックします。

その後、お使いのクレジットカード等の登録を行い、購入しましょう。
本サイトでの学習だけなら、最低価格の5ドル分で十分です。
言語モデルの設定|OpenAIのgpt-5-nanoで接続確認
取得したAPIキーを使ってDifyとLLMを繋ぎましょう。
このサイトでは、言語モデルのプロバイダを OpenAI(ChatGPT)、モデルはできるだけコストを抑えられる gpt-5-nano で進めます。
gpt-5-nanoはGPT-5系の中でも「最速・最安」枠として案内されているモデルで、学習用途や軽めのタスクに向いています。
また、DifyクラウドのSandboxは「まず試す」ための無料枠が用意されており、クレジットカードなしでOpenAIの呼び出しを試すこともできます。
すぐに使い切るため独自APIキーは必須ですが、使い切ってから設定するのでも問題はありません。

もっと高性能なGPTを選んでもいいけど、使用クレジット(利用料金)には大きな差があるよ。
OpenAIのモデルプロバイダーをインストール
モデル設定はワークスペースの設定から行います。
- 画面右上のアイコンから設定を選択
- モデルプロバイダーを選択
モデルプロバイダーの画面で「Open AI」を探し、インストールしてください。
OpenAIプロバイダを有効化する|Add Providerが必要な場合もある
セットアップを押してAPIキーを認証しましょう。

取得したAPIキーを入力し「保存」をクリックします。
その他の部分は空欄で問題ありません。

正しくセットアップ完了すると、右側の「API KEY 1」の部分に緑色のしるしが付きます。

システムモデル設定|安く・速く試すための設定
OpenAIを使える状態にできたら、次はモデルを gpt-5-nano にします。
これは学習用として、性能よりもコスパを優先した選択です。
「モデルプロバイダー」画面の右上にある「システムモデル設定」をクリックして、以下のように入力してください。

| 項目 | モデル |
|---|---|
| システム推論モデル | gpt-5-nano |
| 埋め込みモデル | text-embedding-3-small |
| Rerank モデル | 空欄 |
| 音声-to-テキストモデル | gpt-4o-mini-transcribe |
| テキスト-to-音声モデル | tts-1 |
実際に運用する際に適切な設定は別の記事で解説します。

仮に現時点での最高性能のGPTを選んだら、5ドルではとても足りない…
10倍以上の価格差があるよ。
まとめ
今回は、Difyで生成AIアプリを作り始めるための「準備」を一通り終わらせました。
Difyにはクラウド版とオンプレミス版がありますが、まずは手軽に始められるクラウド版でOKです。
登録してワークスペース画面まで到達できれば、開発のスタートラインに立てています。
次のLesson1-3では、いよいよ最初のチャットボットを作ります。ここまで整えた“土台”を使って、実際に動くアプリを一緒に作っていきましょう。


