Autonomous Agent Manual (Self-Navigating)

基本: 「Amazonで一番安いiPhoneケースを探して」
ニュース: 「Yahooニュースで最新のIT記事をチェックして」
調査: 「Googleで〇〇について調べて要約して」

概要

AI (Gemini 3.0 Flash) がブラウザ画面（スクリーンショット）を直接見て、目的に向かって自律的に操作を決定・実行する「自律型ブラウザエージェント」のマニュアルです。

Discordチャンネル #ai-commands にて指示を出します。

指示: ユーザーがゴールを提示。
思考ループ:
- ブラウザ起動 → スクショ撮影
- AI思考: 「次は検索窓に入力すべきだ」
- アクション実行: 入力 → Enter
- （これをゴール達成まで繰り返す）
完了: 結果をテキストとスクリーンショットで報告。