Webスクレイピングで営業リストを作成する(5)
スクリプト実行結果
実行結果を手作業で整形していきます。
結果ファイルNo対象内容対応方針1シート全体エラーデータの削除Excelで手動対応2シート全体重複データの削除Excelで手動対応3シート全体A列にNoを振るExcelで手動対応4シート全体B列に各
Webスクレイピングで営業リストを作成する(4)
表の内容を処理に組み込んでいきます。
No対象内容対応方針1シート全体エラーデータの削除Excelで手動対応2シート全体重複データの削除Excelで手動対応3シート全体A列にNoを振るExcelで手動対応4シート全体B列に各裁判所ページのURLを出力Seleniumで対応5裁判所名不要文 ...
Webスクレイピングで営業リストを作成する(3)
前回の内容をベースに対応方針を考えます。
前回の対応エラーデータの削除重複データの削除
A列にNoを振る
分類欄の追加(B~E列)
裁判所名データ整形G列追加
不要文言除去(『の所在地』)
郵便番号不要文言置換(『〒』)
ハイフン部分が ...
Webスクレイピングで営業リストを作成する(2)
前回の裁判所所在地のExcelシートを整形する方法を考えます。
下準備フィルタの設定ファイルを開きます。件数は995件です。
先頭行にフィルタを設定します。
エラーデータの削除A列からエラーデータを抽出します。
エラー以外のチェックを外す249行 ...
Webスクレイピングで営業リストを作成する(1)
動画はこちら
あるサイトから、企業・店舗などの情報を収集して、営業リストを作成します。一般にWebスクレイピングと呼ばれる方法です。
実際の個人や企業データを表示するのは問題があるので、ケーススタディとして、全国の裁判所情報を収集することにします。
各地の裁判所の所 ...
Googleマップを検索して「訪問指示書」を自動作成
Excelの「受付一覧表」を元に、Wordで「訪問指示書」を自動作成します。
一覧表の住所情報から、Googleマップで地図を取得して、Wordに貼り付けます。
ファイル名でソートしやすいように、訪問指示書のファイル名には「担当者」と「日付」を含めます。
自動操作の ...
「Yahoo!乗換案内」を自動操作
「Yahoo!乗換案内」の操作をSeleniumで自動化します。Excelから経路情報を読み込んでブラウザに入力し、結果を取得する操作を自動で行います。画面項目の取得にXPathを利用しますが、XPath取得ツールとXPath検証ツールを使用することで、Pythonスクリプトの作成工数を削減し ...