Browser automation with persistent page state. Use when users ask to navigate websites, fill forms, take screenshots, extract web data, test web apps, or automate browser workflows. Trigger phrases include "go to [url]", "click on", "fill out the form", "take a screenshot", "scrape", "automate", "test the website", "log into", or any browser interaction request.
Installation
Details
Usage
After installing, this skill will be available to your AI coding assistant.
Verify installation:
skills listSkill Instructions
name: dev-browser description: "Browser automation with persistent page state. Use when users ask to navigate websites, fill forms, take screenshots, extract web data, test web apps, or automate browser workflows. Trigger phrases include "go to [url]", "click on", "fill out the form", "take a screenshot", "scrape", "automate", "test the website", "log into", or any browser interaction request." allowed-tools: ["Bash", "Read"] context: fork
Dev Browser Skill (agent-browser)
ブラウザ自動化を行うスキル。agent-browser CLI を使用して、UI デバッグ・検証・自動操作を実行します。
トリガーフレーズ
このスキルは以下のフレーズで自動起動します:
- 「ページを開いて」「URLを確認して」
- 「クリックして」「入力して」「フォームに」
- 「スクリーンショットを撮って」
- 「UIを確認して」「画面をテストして」
- "open this page", "click on", "fill the form", "screenshot"
機能詳細
| 機能 | 詳細 |
|---|---|
| ブラウザ自動化 | See references/browser-automation.md |
| AI スナップショットワークフロー | See references/ai-snapshot-workflow.md |
実行手順
Step 0: agent-browser の確認
# インストール確認
which agent-browser
# 未インストールの場合
npm install -g agent-browser
agent-browser install
Step 1: ユーザーのリクエストを分類
| リクエストタイプ | 対応アクション |
|---|---|
| URL を開く | agent-browser open <url> |
| 要素をクリック | スナップショット → agent-browser click @ref |
| フォーム入力 | スナップショット → agent-browser fill @ref "text" |
| 状態確認 | agent-browser snapshot -i -c |
| スクリーンショット | agent-browser screenshot <path> |
| デバッグ | agent-browser --headed open <url> |
Step 2: AI スナップショットワークフロー(推奨)
ほとんどの操作で、まずスナップショットを取得してから要素参照で操作します:
# 1. ページを開く
agent-browser open https://example.com
# 2. スナップショット取得(AI 向け、インタラクティブ要素のみ)
agent-browser snapshot -i -c
# 出力例:
# - link "Home" [ref=e1]
# - button "Login" [ref=e2]
# - input "Email" [ref=e3]
# - input "Password" [ref=e4]
# - button "Submit" [ref=e5]
# 3. 要素参照で操作
agent-browser click @e2 # Login ボタンをクリック
agent-browser fill @e3 "user@example.com"
agent-browser fill @e4 "password123"
agent-browser click @e5 # Submit
Step 3: 結果の確認
# 現在の状態をスナップショットで確認
agent-browser snapshot -i -c
# または URL を確認
agent-browser get url
# スクリーンショットを取得
agent-browser screenshot result.png
クイックリファレンス
基本操作
| コマンド | 説明 |
|---|---|
open <url> | URL を開く |
snapshot -i -c | AI 向けスナップショット |
click @e1 | 要素をクリック |
fill @e1 "text" | フォームに入力 |
type @e1 "text" | テキストを入力 |
press Enter | キーを押す |
screenshot [path] | スクリーンショット |
close | ブラウザを閉じる |
ナビゲーション
| コマンド | 説明 |
|---|---|
back | 戻る |
forward | 進む |
reload | リロード |
情報取得
| コマンド | 説明 |
|---|---|
get text @e1 | テキスト取得 |
get html @e1 | HTML 取得 |
get url | 現在の URL |
get title | ページタイトル |
待機
| コマンド | 説明 |
|---|---|
wait @e1 | 要素を待機 |
wait 1000 | 1秒待機 |
デバッグ
| コマンド | 説明 |
|---|---|
--headed | ブラウザを表示 |
console | コンソールログ |
errors | ページエラー |
highlight @e1 | 要素をハイライト |
セッション管理
複数のタブ/セッションを並列管理:
# セッションを指定
agent-browser --session admin open https://admin.example.com
agent-browser --session user open https://example.com
# セッション一覧
agent-browser session list
# 特定セッションで操作
agent-browser --session admin snapshot -i -c
MCP ブラウザツールとの使い分け
| ツール | 推奨度 | 用途 |
|---|---|---|
| agent-browser | ★★★ | 第一選択。AI 向けスナップショットが強力 |
| chrome-devtools MCP | ★★☆ | Chrome が既に開いている場合 |
| playwright MCP | ★★☆ | 複雑な E2E テスト |
原則: まず agent-browser を試し、うまくいかない場合のみ MCP ツールを使用。
注意事項
- agent-browser はヘッドレスモードがデフォルト
--headedオプションでブラウザを表示可能- セッションは明示的に
closeするまで維持される - 認証が必要なサイトはセッションを活用
More by Chachamaru127
View allSets up deployment, analytics, and health monitoring for projects. Use when user mentions デプロイ, deploy, Vercel, Netlify, 公開, アナリティクス, analytics, GA, Google Analytics, 環境診断, health check. Do NOT load for: 実装作業, ローカル開発, レビュー, セットアップ.
Implements features and writes code based on Plans.md tasks. Use when user mentions 実装, implement, 機能追加, コードを書いて, 機能を作って, feature, coding, 新機能, implementing functions, classes, or features, 新しい関数. Do not use for review or build verification.
Initializes session with environment check and task status overview. Use when user mentions セッション開始, 作業開始, 状況確認, what should I work on, start session. Do NOT load for: 実装作業, レビュー, セッション途中の作業.
Configures 2-Agent workflow between PM and implementation roles. Use when user mentions 2-Agent, 2エージェント, PM連携設定, Cursor設定, Cursor連携, 2-agent運用. Do NOT load for: 単独運用, ワークフロー実行, ハンドオフ処理.
