「30分でZapierとOpenAIをつないで、社内SlackにAIエージェントを作りました!」
2024年頃、そんな記事がSNSに溢れました。しかし、それを実務で運用し続けたエンジニアたちは、現在深い絶望を味わっています。

「API費用の青天井な高騰」「機密情報をパブリックAPIに投げることへの法務部のNG」です。どんなに優れたワークフローを組んでも、この2つの壁にぶつかり、多くの企業内エージェントがPoC(概念実証)の段階で死んでいきました。

今回は、この「クラウドAPI依存の自動化」から脱却し、いま最も熱い新標準プロトコル『MCP (Model Context Protocol)』とローカルLLMを組み合わせ、Makeを純粋なオーケストレーターとしてのみ活用する「ハイブリッド型社内エージェント」の設計とその泥臭い実装の限界について解説します。

1. 今話題の「MCP (Model Context Protocol)」とは何か?

MCPは、LLMが外部のデータソースやツールと通信するためのオープンな標準規格です。「AIのためのUSB端子」と表現されることもあります。

これまで、MakeやZapierでLLMを動かす場合、LLM側に「このツールの使い方はこうだよ」と長文のプロンプトで教え込んだり、SaaS側で無理やりFunction CallingのJSONをパースしたりする必要がありました。MCPは、この「LLMとツールの接続」を劇的にシンプルかつセキュアにします。

  • データのローカル完結: MCPサーバーを社内ネットワークに立てることで、機密データベースへのアクセスを外部に出さずに済む。
  • プラグインの共通化: 一度MCPサーバーを構築すれば、Claude DesktopでもローカルのOllamaでも、同じ手順で社内DBを検索させることができる。

2. 【実践】ローカルLLM + MCP + Makeのハイブリッドアーキテクチャ

私たちが構築したのは、以下のようなアーキテクチャです。

  1. 推論エンジン (Brain): 社内サーバーで稼働する Ollama (Llama 3 系)。クラウドAPI料金はゼロ、情報漏洩リスクもゼロ。
  2. データアクセス (Arms & Eyes): 社内DBや社内Wikiにアクセスする MCP Server。ローカルLLMから直接叩かせる。
  3. オーケストレーション (Nerve): Make。スケジューリング、SlackからのWebhook受け取り、最終的なメール送信などの「確定的なプロセス」のみを担当。

この構成の最大のメリットは、「AIが考える部分」と「機密データを触る部分」を社内(ローカル)に閉じ込めつつ、Slackへの通知や外部SaaSとの繋ぎ込みといった「泥臭い連携」はMakeに丸投げできる点です。

3. 【独自視点】実際に作って分かった「地獄」と限界

理論上は完璧でした。コストもゼロ、セキュリティも万全。しかし、実際に運用してみると、そこにはクラウドAPIを使っていた頃には想像もしなかった地獄が待っていました。

地獄1: ローカルLLMの「推論遅延」でMakeがタイムアウトする

Ollamaに複雑なRAG(検索拡張生成)タスクを投げた結果、レスポンスに40秒〜1分かかることが多発しました。結果として、MakeのWebhookのタイムアウト制限(通常数十秒)に引っかかり、エラーが頻発。

解決策(ワークアラウンド): Makeの処理を同期型から「非同期型(キューイングとコールバック)」に変更し、アーキテクチャがさらに複雑化しました。「手軽な自動化」とは程遠い状態です。

地獄2: JSON出力の揺らぎによる「パースエラー地獄」

GPT-4oのようなクラウド最高峰モデルは、Makeに渡すためのJSONフォーマットを完璧に出力してくれます。しかし、ローカルで動かす7B〜14Bクラスの軽量LLMは、指示してもJSONの最後に不要なバッククォート(```)を付けたり、カンマを忘れたりします。

「LLMが吐き出した微細なJSONの構文エラーで、Makeの次のモジュールが死ぬ」
このエラーハンドリングのために、Makeの中に「正規表現でJSONっぽい部分だけを無理やり抽出し、エラーなら再リクエストする」という醜いリカバリーモジュールを組むハメになりました。

4. 結論:私たちはローカル回帰すべきか?

MakeやZapierなどのSaaS連携ツールは、あくまで「システムとシステムを確定的に繋ぐ」ことに特化しています。そこに「揺らぎのあるAI(特にローカルの小型モデル)」を組み込むと、つなぎ目のエラーハンドリングに莫大な工数がかかります。

結論として、現在の最適解は以下のように切り分けるべきです:

  • 社内機密を含まない定型的な要約・生成: 従来通り Make + OpenAI API (または Anthropic API)
  • 社内データを使った自律型エージェント: Make/Zapierへの過度な依存をやめ、ローカル環境(Docker等)で Dify + MCP + Ollama を組み合わせて自己完結させる。Makeはあくまで「トリガー」と「エンドポイント」に徹する。

「APIを繋げば何でもできる時代」は終わりを告げ、アーキテクチャ全体のコストとリスクを設計できる真のエンジニアリング能力が、改めて問われています。