Browser UseでAIにブラウザを丸投げしたら、RPAの常識が壊れた
AIにブラウザ操作を丸投げしてみた。結論から言うと、RPAの概念が変わる。 セレクタを書かなくていい。XPathを調べなくていい。「このページの3番目のボタンをクリックして、出てきたフォームに名前を入力して、送信して」——自然言語でそう伝えるだけで、AIエージェントが勝手にブラウザを操作してくれる。Browser
7件の記事
AIにブラウザ操作を丸投げしてみた。結論から言うと、RPAの概念が変わる。 セレクタを書かなくていい。XPathを調べなくていい。「このページの3番目のボタンをクリックして、出てきたフォームに名前を入力して、送信して」——自然言語でそう伝えるだけで、AIエージェントが勝手にブラウザを操作してくれる。Browser
!Cline(/images/posts/cline-ai-coding-agent.png) Cursorは月額$20。Claude Codeを使うにはClaude Proが$20。GitHub Copilotは$10。AIコーディングツールの月額がじわじわと積み上がっていく。 Clineは$0だ。 VS C
AIエージェントを自分で作りたい。でもLangChainのPythonコードは読めない。n8nのノードを繋ぐのも正直しんどい。そんな人が最初に触るべきプラットフォームは何か? 筆者の答えは、現時点ではDify(https://dify.ai/)だ。 GitHub 114kスターの意味 Difyは2023年に公
!Mistral AI(/images/posts/mistral-small4-voxtral-tts.png) OpenAI、Anthropic、Googleの3強が支配するLLM市場で、フランスのMistral AIが独自の路線を走り続けている。彼らの武器は「オープンウェイト」と「効率性」だ。 2026年に
OpenAIがついにCLIに本気を出した。それも、片手間の実験プロジェクトではなく、Apache 2.0ライセンスのフルオープンソースで、GitHub Stars 67,000超、コントリビューター400人以上という規模感で殴り込んできた。Codex CLI。ターミナルで動く軽量コーディングエージェントだ。 正直に
GitHub 351,000スター。フォーク数71,000超。2025年11月の公開からわずか数ヶ月で、オープンソースAIプロジェクト史上最速クラスの成長を遂げたOpenClaw。WhatsApp、Telegram、Slack、iMessage、Discordなど50以上のメッセージングプラットフォームに接続し、完全
!OpenCode(/images/posts/opencode-terminal-ai-agent.jpg) Claude Codeは最強のターミナルAIコーディングエージェントだと思う。プランニングの正確さ、コンテキストの扱い方、自律的にタスクを回す力。どれをとっても頭一つ抜けている。 ただ、月額$20のCl