〜 Mac Mini × OpenClaw で実現するスマホ指示型の業務自動化 〜
はじめに:AIエージェントとは何か
「AIを使って業務を自動化したい」と思いながらも、何から始めればいいかわからない経営者の方は多いのではないでしょうか。ChatGPTやClaudeを試したことはあっても、毎回ブラウザを開いて指示を入力するのは手間がかかります。
AIエージェントとは、AIに「自律的に行動させる仕組み」のことです。単に質問に答えるだけでなく、メールを確認する・ファイルを整理する・レポートを作成するといった一連の作業を、人間の代わりに実行させることができます。
本記事では、筆者が実際に構築したAIエージェント環境を紹介します。スマートフォンのDiscordからメッセージを送るだけで、Mac Miniに常駐したAIエージェントが業務を代行する仕組みです。
【重要:安全面には細心の注意を払い構築する必要があります。個人情報、お客様の情報など入っていない独立したパソコンで、アクセスなども制限して構築しています】
1. 何を実現したいのか
フェーズ1:今すぐ使える業務自動化
まず最初に実装したい機能は以下の2つです。
- 重要メールの仕分けと要約、および返信下書きの自動作成(送信は人間が判断)
- レシート写真を撮って送るだけで、マネーフォワードへのインポート用CSVを自動生成
将来的に実装したいこと
- 自社サービス(jp)の定期的な動作テストの自動化
- 顧客からの問い合わせメールの分類・返信案の自動作成
重要なのは「AIが勝手に送信・実行しない設計」にすること。最終判断は常に人間が行い、AIは「下準備」に徹することでリスクを最小化します。
2. ツール選定:なぜOpenClawを選んだのか
OpenClawとは
OpenClawは、自分のPCやサーバー上で動かすオープンソースのAIエージェント基盤です。WhatsApp・Telegram・Discord・Slackなど12以上のメッセージングアプリと連携でき、スマートフォンから日常使いのチャットアプリ経由でAIに指示を出せます。
最大の特徴は「ローカルファースト」であること。会話データはすべて自分のPCに保存され、外部サービスには送信されません。機密性の高い業務情報を扱う際も安心して使えます。
他ツールとの比較
| ツール | 特徴 | 向いている用途 | コスト |
| OpenClaw | ローカル動作・12以上のチャンネル対応・オープンソース | 業務自動化・プライバシー重視の用途 | 無料(AIモデルのAPI費用のみ) |
| ChatGPT(ブラウザ) | 手軽・高性能・最新情報対応 | 都度の質問・文章作成 | 月額$20〜 |
| Zapier / Make | ノーコードで自動化・多数のサービス連携 | 定型的なワークフロー自動化 | 月額$20〜$100程度 |
| 独自開発 | 自由度最高・業務に完全最適化 | 大規模・複雑な自動化 | 開発コスト大 |
AIモデルの選定:ChatGPT Plus × Codex OAuth
OpenClawはAnthropicのClaude・OpenAIのGPT・Googleのgeminiなど複数のAIモデルに対応しています。今回はChatGPT Plusのサブスクリプション(月額$20)に含まれるCodex OAuth認証を採用しました。
通常のAPI利用は使った分だけ課金される従量課金制ですが、ChatGPT Plusサブスクのキーを使うことで月額固定での運用が可能になります。AIエージェントは頻繁にAIを呼び出すため、従量課金だとコストが予測しにくいというデメリットがあります。月額固定化はコスト管理の観点から非常に重要なポイントです。
※プライバシーのが要求されるものについてはローカルLLMを使用予定です。性能は落ちますが、外部のLLMとのやり取りが発生しないため安心して使えます。
| 認証方式 | 課金方式 | 月額目安 | おすすめ |
| ChatGPT Plus Codex OAuth | 月額固定 | $20(Plus) | ◎ エージェント向き |
| OpenAI APIキー | 従量課金 | 使用量次第($10〜$100+) | ○ 軽い用途向き |
| Anthropic APIキー | 従量課金 | 使用量次第($20〜$200+) | △ コスト管理注意 |
3. ハードウェア選定:Mac Mini M2を選んだ理由
AIエージェントは24時間365日稼働させることが前提です。そのため、ハードウェア選定では「消費電力」「静音性」「処理性能」「コスト」のバランスが重要になります。
| 機種 | 消費電力 | 処理性能 | 価格帯 | エージェント用途 |
| Mac Mini M2(24GB) | 約10〜30W | 高(Apple Silicon) | 10〜15万円 | ◎ 最適 |
| 一般的なWindowsミニPC | 約15〜45W | 中 | 5〜10万円 | ○ 可能 |
| Raspberry Pi 5 | 約5〜10W | 低〜中 | 1〜2万円 | △ 軽い処理のみ |
| クラウドサーバー(VPS) | 電気代不要 | 選択次第 | 月額1,000〜5,000円 | ○ 可能(セキュリティ設定要) |
Mac Mini M2(24GBメモリ)を選んだ主な理由は以下の通りです。
- Apple Siliconによる高効率処理:低消費電力でも十分な処理能力
- 静音性:24時間稼働でも気にならない
- macOSのセキュリティ機能:FileVault・ファイアウォール・launchdによる自動起動
- 将来的なローカルLLM実行:24GBメモリがあれば7B〜13Bクラスのモデルをローカルで動かせる
※結果的に現在はAIは外部AIを使用しているので、必ずしも上記のスペックは必要ありません。将来的に一部のAI機能をローカルLLMで実行できることを想定しています。
4. セキュリティ設計の考え方
AIエージェントをビジネスに導入する際に最も重要なのがセキュリティです。エージェントは様々なサービスにアクセスする権限を持つため、適切な設計なしには情報漏洩や誤操作のリスクがあります。
3つの防御原則
① 入口を絞る
エージェントへの指示経路をDiscordのプライベートサーバーのみに限定しました。さらに、ボットが反応するのは自分のユーザーIDからのメッセージだけになるようコードレベルで制限しています。
公開サーバーや不特定多数がアクセスできる環境にボットを置かないことが大原則です。
② 権限を最小化する
MacにOpenClaw専用の「標準ユーザー」(管理者権限なし)を作成し、エージェントはそのユーザーとして動作させています。万が一エージェントが乗っ取られても、管理者操作(システム変更・他ユーザーのファイルアクセス等)はできない設計です。
③ 操作範囲を限定する
エージェントがファイル操作できるのは専用の「AgentWorkspace」フォルダのみ。それ以外のフォルダへのアクセスは権限設定(chmod 700)によって制限しています。
「送信しない設計」の徹底
フェーズ1では、AIエージェントにメールの「送信」権限を与えていません。エージェントが行うのは「重要メールの要約」と「返信下書きの作成」まで。実際の送信操作は人間がGmailを開いて行います。
これは一見非効率に見えますが、AIの判断ミスや誤送信リスクを排除するために重要な設計です。信頼性が確認できた段階で、段階的に自動化の範囲を広げていく方針です。
5. 具体的な業務活用イメージ
活用例①:重要メールの仕分けと返信下書き
毎朝Discordに「今日の重要メールを確認して」と送るだけで、エージェントが以下の処理を自動実行します。
- 新着メールをスキャンし、重要度を判定(請求・クレーム・期限・顧客ドメインなど)
- 重要メールの要約をDiscordに返信(件名・送信者・要約・重要判定理由)
- 返信案を複数パターン(丁寧版・簡潔版)で自動作成しGmailに下書き保存
Discordへの返信イメージ: 📧【重要メール】3件 / 未確認12件 ① 件名:○○様より納期確認 要約:今週中の回答希望。先週の発注件について。 【返信案A】「ご連絡ありがとうございます。確認次第本日中にご連絡いたします。」 ✅ Gmailに下書き保存済み
※メールの処理についてはローカルLLMを使用予定です。性能は落ちますが、外部のLLMとのやり取りが発生しないため安心して使えます。
活用例②:レシートからマネーフォワード仕訳CSV生成
経費精算の手間を大幅に削減できます。スマートフォンでレシートを撮影してDiscordに送信するだけで、以下の処理が自動実行されます。
- AI(Vision機能)がレシート画像をOCRで読み取り
- 店名・日付・金額・税区分を自動抽出
- 勘定科目を推定してマネーフォワード仕訳帳インポート用CSVを生成
- 確認用サマリとCSVファイルをDiscordに返信
UIの自動操作ではなくCSV出力方式にすることで、マネーフォワードの仕様変更に影響されない安定した運用が可能です。
将来活用例③:自社サービスの定期動作テスト
Playwrightを使ったブラウザ自動化により、自社WebサービスのE2Eテストをエージェントが自動実行。「サイトをチェックして」とDiscordに送るだけで、主要な導線をテストしてスクリーンショットとともに結果を報告します。
6. 実際に構築して気づいたこと
想定より詰まったポイント
今回の構築はMacに不慣れな状態から始めましたが、特に以下の点で詰まりました。
- jsのバージョン管理:OpenClawはNode 22以上が必要。brewのデフォルトインストールではバージョンが合わない場合がある
- ユーザー権限の分離:Homebrewは管理者ユーザーでインストールし、パスの設定はエージェントユーザーにも個別に必要
- Discordの設定:サーバーID・チャンネルID・ユーザーIDの3つが必要で、設定キー名が公式ドキュメントと一致しないと動かない
- ペアリング認証:初回DM時にはペアリングコードの承認が必要(セキュリティ上正常な動作)
想定以上によかったこと
- ChatGPT Plus Codex OAuthによる月額固定運用:従量課金の心配がなく気軽に試せる
- launchdによる自動起動:Mac再起動後もOpenClawが自動で立ち上がる
- OpenClaw Web Dashboard:ブラウザから動作状況・ログ・設定を確認できる管理画面が標準装備
- セキュリティ設計の柔軟さ:DM pairing・チャンネルallowlist・ユーザーID制限など細かなアクセス制御が可能
7. 導入コストのまとめ
| 項目 | 費用 | 備考 |
| Mac Mini M2(24GB / 512GB) | 約130,000円 | 初期費用(一回のみ) |
| ChatGPT Plus | $20 / 月(約3,000円) | Codex OAuth利用のため |
| 電気代 | 約200〜500円 / 月 | 消費電力10〜30W程度 |
| OpenClaw本体 | 無料 | OSSライセンス(MIT) |
| Gmail API | 無料 | Google Cloud無料枠内 |
| 合計(初年度) | 約170,000円 | 2年目以降は約45,000円/年 |
社員1人が月に数十時間をメール処理・経費精算に費やしているとすれば、時給換算でもすぐに元が取れる計算になります。また、夜間・休日でもエージェントは稼働しているため、営業時間外の問い合わせ対応準備なども可能になります。
まとめ
AIエージェントの導入は、大企業だけの話ではありません。Mac Mini 1台とオープンソースのOpenClawを組み合わせることで、中小企業でも月数万円のコストでAIエージェント環境を構築できます。
重要なのは「最初から完全自動化を目指さない」こと。フェーズ1では「AIが下準備し、人間が最終判断する」設計にすることで、リスクを最小化しながら業務効率化の恩恵を受けられます。
本記事が、AIエージェント導入を検討している経営者・ビジネスマンの方の参考になれば幸いです。
次回記事予告:Gmail API連携の具体的な設定方法と、メールトリアージの実装手順を解説予定です。
─────────────────────────────────
本記事は実際の構築経験をもとに執筆しています。設定値・コスト・仕様は、2026年2月時点のものです。

