FlowTune Media

Webサイトが変わっても壊れないスクレイピング — Browse AIが「ロボット訓練」で解決したこと

Webスクレイピングで一番つらいのは、動いたあとだ。

セレクタを指定して、データが取れるようになって、定期実行をセットする。ここまでは順調に行く。問題はその2週間後、対象のWebサイトがリニューアルされてクラスもHTMLの構造も変わり、スクレイパーが何も取れなくなる。手動でセレクタを直して、テストして、また動くようにする。この繰り返しで、そのうち面倒になってやめてしまう。

Browse AIが解いているのは、この「壊れた後」の問題だ。

「ロボット訓練」という発想

Browse AIの仕組みは、従来のスクレイピングツールとは少し違う。コードを書かない。CSSセレクタも指定しない。

代わりに、ブラウザ上で対象のWebサイトを開き、取りたいデータをクリックして教える。「この商品名」「この価格」「このレビュー数」。Browse AIはこれを「ロボットの訓練」と呼んでいる。

訓練が終わると、Browse AIはそのサイトの構造を学習し、データ抽出用のロボットを生成する。ここからが重要で、対象サイトのレイアウトが変わっても、Browse AIが自動で構造の変化を検知し、ロボットを再調整する。人間がセレクタを書き直す必要がない。

これは地味に大きい。競合のOctoparseやWebScraper.ioのような非AIツールでは、サイト変更のたびにワークフローを手動で修正する必要がある。Browse AIの自動追従は、スクレイピングを「セットアップして終わり」にする可能性がある。

何に使えるか

Browse AIの典型的な使い方はいくつかある。

競合モニタリングが最も多いユースケースだろう。EC事業者が競合の価格を毎日チェックしたり、SaaS企業が競合の機能ページの変更を追跡したりする。スケジュール実行を設定すれば、毎朝Google Sheetsに最新データが入っている状態を作れる。

リード獲得にも使える。求人サイトや業界ディレクトリから企業情報を抽出して、営業リストを作るパターン。Airtableと連携させれば、抽出データがそのまま営業パイプラインに流れる。

市場調査では、レビューサイトやSNSからの意見収集に使われることが多い。商品レビューの傾向分析や、特定キーワードの出現頻度のトラッキングなど。

Google Sheets、Airtable、Zapier、Make(旧Integromat)など7,000以上のツールと連携できるので、抽出したデータをそのまま業務フローに組み込める。

料金 — 無料枠は「お試し」程度

Browse AIはクレジット制で、無料プランでは月50クレジットが付与される。1回のスクレイピングで1〜数クレジット消費するので、月50回程度の実行が可能だ。使い心地を試すには十分だが、本格的に使うには足りない。

有料プランはPersonalが月額$19(年払い、約2,900円)から。月払いだと$48になるので、年払いのほうがかなり割安。Professionalは月額$69(年払い、約10,500円)で、より多くのクレジットと同時実行数が増える。

正直、月$19〜というのはスクレイピングツールとしては安くない。無料のChrome拡張「Instant Data Scraper」なら、テーブル状のデータを一発で抜ける。Octoparseの無料プランでも月50,000行まで取れる。

ただしこれらは「その場で1回取る」ツールだ。Browse AIが差別化しているのは「毎日自動で取り続ける」部分。定期実行とサイト変更への自動追従を含めた価格としては、妥当な範囲だと思う。

気になる点

Browse AIの弱点は、複雑なスクレイピングへの対応だ。

ログインが必要なサイトや、無限スクロールで読み込まれるコンテンツ、JavaScriptで動的に生成される要素については、対応はしているものの、安定性にばらつきがあるという声が海外のレビューでは見られる。こうした高度なケースではOctoparseのほうが設定の自由度が高い。

もう1つ、クレジット制の分かりにくさがある。何にどれだけクレジットを消費するかが事前に見積もりにくく、月末に想定より多く使っていたということが起きやすい。ダッシュボードで消費量は確認できるが、事前のコスト計算は難しい。

誰が使うべきか

Browse AIは「コードを書かずに、Webからのデータ収集を自動化したい」人向けのツールだ。

マーケター、EC事業者、営業チームのように、技術的な知識がなくても競合の価格や市場データを定期的に集めたい人には合っている。特に「サイトが変わるたびにエンジニアに修正を頼む」というサイクルから抜け出したい組織にとって、自動追従は実務的なメリットが大きい。

逆に、1回だけデータを取りたいならInstant Data Scraperで十分だし、複雑なワークフローが必要ならOctoparseやApifyのほうが柔軟性がある。Browse AIは「簡単に始められて、壊れにくい」というポジションにいる。

関連記事