2021年2月4日Selenium自動化プロジェクト

2021年2月4日

スクリプト実行結果

実行結果を手作業で整形していきます。

結果ファイル

No対象内容対応方針1シート全体エラーデータの削除Excelで手動対応2シート全体重複データの削除Excelで手動対応3シート全体A列にNoを振るExcelで手動対応4シート全体B列に各

2021年2月4日Selenium自動化プロジェクト

2021年2月4日

表の内容を処理に組み込んでいきます。

No対象内容対応方針1シート全体エラーデータの削除Excelで手動対応2シート全体重複データの削除Excelで手動対応3シート全体A列にNoを振るExcelで手動対応4シート全体B列に各裁判所ページのURLを出力Seleniumで対応5裁判所名不要文 ...

2021年2月4日Selenium自動化プロジェクト

2021年2月4日

前回の内容をベースに対応方針を考えます。

前回の対応エラーデータの削除
重複データの削除
A列にNoを振る
分類欄の追加(B~E列)
裁判所名データ整形G列追加
不要文言除去(『の所在地』)
郵便番号不要文言置換(『〒』)
ハイフン部分が ...

2021年2月4日Selenium自動化プロジェクト

2021年2月4日

前回の裁判所所在地のExcelシートを整形する方法を考えます。

下準備フィルタの設定

ファイルを開きます。件数は995件です。

先頭行にフィルタを設定します。

エラーデータの削除

A列からエラーデータを抽出します。

エラー以外のチェックを外す

249行 ...

2021年2月4日Selenium自動化プロジェクト

2021年2月4日

動画はこちら

あるサイトから、企業・店舗などの情報を収集して、営業リストを作成します。一般にWebスクレイピングと呼ばれる方法です。
実際の個人や企業データを表示するのは問題があるので、ケーススタディとして、全国の裁判所情報を収集することにします。
各地の裁判所の所 ...