dev-browser

@Chachamaru127/dev-browser

Chachamaru127

126

9 forks

Updated 1/18/2026

View on GitHub

Browser automation with persistent page state. Use when users ask to navigate websites, fill forms, take screenshots, extract web data, test web apps, or automate browser workflows. Trigger phrases include "go to [url]", "click on", "fill out the form", "take a screenshot", "scrape", "automate", "test the website", "log into", or any browser interaction request.

Installation

$skills install @Chachamaru127/dev-browser

Claude Code

Cursor

Copilot

Codex

Antigravity

Details

RepositoryChachamaru127/claude-code-harness

Pathskills/dev-browser/SKILL.md

Branchmain

Scoped Name@Chachamaru127/dev-browser

Usage

After installing, this skill will be available to your AI coding assistant.

Verify installation:

skills list

Skill Instructions

name: dev-browser description: "Browser automation with persistent page state. Use when users ask to navigate websites, fill forms, take screenshots, extract web data, test web apps, or automate browser workflows. Trigger phrases include "go to [url]", "click on", "fill out the form", "take a screenshot", "scrape", "automate", "test the website", "log into", or any browser interaction request." allowed-tools: ["Bash", "Read"] context: fork

Dev Browser Skill (agent-browser)

ブラウザ自動化を行うスキル。agent-browser CLI を使用して、UI デバッグ・検証・自動操作を実行します。

トリガーフレーズ

このスキルは以下のフレーズで自動起動します：

「ページを開いて」「URLを確認して」
「クリックして」「入力して」「フォームに」
「スクリーンショットを撮って」
「UIを確認して」「画面をテストして」
"open this page", "click on", "fill the form", "screenshot"

機能詳細

機能	詳細
ブラウザ自動化	See references/browser-automation.md
AI スナップショットワークフロー	See references/ai-snapshot-workflow.md

実行手順

Step 0: agent-browser の確認

# インストール確認
which agent-browser

# 未インストールの場合
npm install -g agent-browser
agent-browser install

Step 1: ユーザーのリクエストを分類

リクエストタイプ	対応アクション
URL を開く	`agent-browser open <url>`
要素をクリック	スナップショット → `agent-browser click @ref`
フォーム入力	スナップショット → `agent-browser fill @ref "text"`
状態確認	`agent-browser snapshot -i -c`
スクリーンショット	`agent-browser screenshot <path>`
デバッグ	`agent-browser --headed open <url>`

Step 2: AI スナップショットワークフロー（推奨）

ほとんどの操作で、まずスナップショットを取得してから要素参照で操作します：

# 1. ページを開く
agent-browser open https://example.com

# 2. スナップショット取得（AI 向け、インタラクティブ要素のみ）
agent-browser snapshot -i -c

# 出力例:
# - link "Home" [ref=e1]
# - button "Login" [ref=e2]
# - input "Email" [ref=e3]
# - input "Password" [ref=e4]
# - button "Submit" [ref=e5]

# 3. 要素参照で操作
agent-browser click @e2           # Login ボタンをクリック
agent-browser fill @e3 "user@example.com"
agent-browser fill @e4 "password123"
agent-browser click @e5           # Submit

Step 3: 結果の確認

# 現在の状態をスナップショットで確認
agent-browser snapshot -i -c

# または URL を確認
agent-browser get url

# スクリーンショットを取得
agent-browser screenshot result.png

クイックリファレンス

基本操作

コマンド	説明
`open <url>`	URL を開く
`snapshot -i -c`	AI 向けスナップショット
`click @e1`	要素をクリック
`fill @e1 "text"`	フォームに入力
`type @e1 "text"`	テキストを入力
`press Enter`	キーを押す
`screenshot [path]`	スクリーンショット
`close`	ブラウザを閉じる

情報取得

コマンド	説明
`get text @e1`	テキスト取得
`get html @e1`	HTML 取得
`get url`	現在の URL
`get title`	ページタイトル

待機

コマンド	説明
`wait @e1`	要素を待機
`wait 1000`	1秒待機

デバッグ

コマンド	説明
`--headed`	ブラウザを表示
`console`	コンソールログ
`errors`	ページエラー
`highlight @e1`	要素をハイライト

セッション管理

複数のタブ/セッションを並列管理：

# セッションを指定
agent-browser --session admin open https://admin.example.com
agent-browser --session user open https://example.com

# セッション一覧
agent-browser session list

# 特定セッションで操作
agent-browser --session admin snapshot -i -c

MCP ブラウザツールとの使い分け

ツール	推奨度	用途
agent-browser	★★★	第一選択。AI 向けスナップショットが強力
chrome-devtools MCP	★★☆	Chrome が既に開いている場合
playwright MCP	★★☆	複雑な E2E テスト

原則: まず agent-browser を試し、うまくいかない場合のみ MCP ツールを使用。

注意事項

agent-browser はヘッドレスモードがデフォルト
--headed オプションでブラウザを表示可能
セッションは明示的に close するまで維持される
認証が必要なサイトはセッションを活用

More by Chachamaru127

View all

deploy

126

Sets up deployment, analytics, and health monitoring for projects. Use when user mentions デプロイ, deploy, Vercel, Netlify, 公開, アナリティクス, analytics, GA, Google Analytics, 環境診断, health check. Do NOT load for: 実装作業, ローカル開発, レビュー, セットアップ.

impl

126

Implements features and writes code based on Plans.md tasks. Use when user mentions 実装, implement, 機能追加, コードを書いて, 機能を作って, feature, coding, 新機能, implementing functions, classes, or features, 新しい関数. Do not use for review or build verification.

session-init

126

Initializes session with environment check and task status overview. Use when user mentions セッション開始, 作業開始, 状況確認, what should I work on, start session. Do NOT load for: 実装作業, レビュー, セッション途中の作業.

2agent

126

Configures 2-Agent workflow between PM and implementation roles. Use when user mentions 2-Agent, 2エージェント, PM連携設定, Cursor設定, Cursor連携, 2-agent運用. Do NOT load for: 単独運用, ワークフロー実行, ハンドオフ処理.

コマンド	説明
`back`	戻る
`forward`	進む
`reload`	リロード