攻略サイトからのスクレイピング

OVERVIEW

ゲームの攻略情報を抽出するために攻略サイトからスクレイピングするプログラムを作成しました。

YEAR 2023

近年のゲームは情報が多く、キャラクターの情報について手作業で情報を集めるのは非常に時間と手間がかかります。本項では攻略サイトから必要な情報のみを抽出・整形し分析しやすい形式にまとめるためのスクレイピングプログラムを作成しました。

なお、スクレイピングに際してrobot.txtの記載に注意し、得られた情報は分析のためのみに利用しております。

使用した方法としてはpythonのBeautiful Soupモジュールを用いる方法とブラウザの開発者ツールを通してjavascriptのソースコードを実行する方法を使い分けて使用しました。


以下はスクレイピングしたサイトです。キャラクターの画像を取得し使用回数を集計しました。

以下ではキャラクター名と各キャラクターに関する数値を取得しました。

取得したデータは並び替え・必要な処理を施した上でcsv形式で保存しました。


以下は出力結果です。画像のIDと画像が使用された回数を使用された回数の多い順に並べ替えて記録しました。

以下はキャラクター名と各キャラクターに関する数値をcsv形式で保存した結果です。

その後これらのデータを用いて様々な分析を行いました。以下は分析の例です。