【脱API連携】ローカルLLMと「MCP」で作る完全セキュアな自律型社内エージェントの全貌と挫折

「30分でZapierとOpenAIをつないで、社内SlackにAIエージェントを作りました！」
2024年頃、そんな記事がSNSに溢れました。しかし、それを実務で運用し続けたエンジニアたちは、現在深い絶望を味わっています。

「API費用の青天井な高騰」と「機密情報をパブリックAPIに投げることへの法務部のNG」です。どんなに優れたワークフローを組んでも、この2つの壁にぶつかり、多くの企業内エージェントがPoC（概念実証）の段階で死んでいきました。

今回は、この「クラウドAPI依存の自動化」から脱却し、いま最も熱い新標準プロトコル『MCP (Model Context Protocol)』とローカルLLMを組み合わせ、Makeを純粋なオーケストレーターとしてのみ活用する「ハイブリッド型社内エージェント」の設計とその泥臭い実装の限界について解説します。

1. 今話題の「MCP (Model Context Protocol)」とは何か？

MCPは、LLMが外部のデータソースやツールと通信するためのオープンな標準規格です。「AIのためのUSB端子」と表現されることもあります。

これまで、MakeやZapierでLLMを動かす場合、LLM側に「このツールの使い方はこうだよ」と長文のプロンプトで教え込んだり、SaaS側で無理やりFunction CallingのJSONをパースしたりする必要がありました。MCPは、この「LLMとツールの接続」を劇的にシンプルかつセキュアにします。

データのローカル完結: MCPサーバーを社内ネットワークに立てることで、機密データベースへのアクセスを外部に出さずに済む。
プラグインの共通化: 一度MCPサーバーを構築すれば、Claude DesktopでもローカルのOllamaでも、同じ手順で社内DBを検索させることができる。

2. 【実践】ローカルLLM + MCP + Makeのハイブリッドアーキテクチャ

私たちが構築したのは、以下のようなアーキテクチャです。

推論エンジン (Brain): 社内サーバーで稼働する Ollama (Llama 3 系)。クラウドAPI料金はゼロ、情報漏洩リスクもゼロ。
データアクセス (Arms & Eyes): 社内DBや社内Wikiにアクセスする MCP Server。ローカルLLMから直接叩かせる。
オーケストレーション (Nerve): Make。スケジューリング、SlackからのWebhook受け取り、最終的なメール送信などの「確定的なプロセス」のみを担当。

この構成の最大のメリットは、「AIが考える部分」と「機密データを触る部分」を社内（ローカル）に閉じ込めつつ、Slackへの通知や外部SaaSとの繋ぎ込みといった「泥臭い連携」はMakeに丸投げできる点です。

3. 【独自視点】実際に作って分かった「地獄」と限界

理論上は完璧でした。コストもゼロ、セキュリティも万全。しかし、実際に運用してみると、そこにはクラウドAPIを使っていた頃には想像もしなかった地獄が待っていました。

地獄1: ローカルLLMの「推論遅延」でMakeがタイムアウトする

Ollamaに複雑なRAG（検索拡張生成）タスクを投げた結果、レスポンスに40秒〜1分かかることが多発しました。結果として、MakeのWebhookのタイムアウト制限（通常数十秒）に引っかかり、エラーが頻発。

解決策（ワークアラウンド）: Makeの処理を同期型から「非同期型（キューイングとコールバック）」に変更し、アーキテクチャがさらに複雑化しました。「手軽な自動化」とは程遠い状態です。

地獄2: JSON出力の揺らぎによる「パースエラー地獄」

GPT-4oのようなクラウド最高峰モデルは、Makeに渡すためのJSONフォーマットを完璧に出力してくれます。しかし、ローカルで動かす7B〜14Bクラスの軽量LLMは、指示してもJSONの最後に不要なバッククォート（```）を付けたり、カンマを忘れたりします。

「LLMが吐き出した微細なJSONの構文エラーで、Makeの次のモジュールが死ぬ」
このエラーハンドリングのために、Makeの中に「正規表現でJSONっぽい部分だけを無理やり抽出し、エラーなら再リクエストする」という醜いリカバリーモジュールを組むハメになりました。

4. 結論：私たちはローカル回帰すべきか？

MakeやZapierなどのSaaS連携ツールは、あくまで「システムとシステムを確定的に繋ぐ」ことに特化しています。そこに「揺らぎのあるAI（特にローカルの小型モデル）」を組み込むと、つなぎ目のエラーハンドリングに莫大な工数がかかります。

結論として、現在の最適解は以下のように切り分けるべきです：

社内機密を含まない定型的な要約・生成：従来通り Make + OpenAI API (または Anthropic API)
社内データを使った自律型エージェント： Make/Zapierへの過度な依存をやめ、ローカル環境（Docker等）で Dify + MCP + Ollama を組み合わせて自己完結させる。Makeはあくまで「トリガー」と「エンドポイント」に徹する。