続・GASでお手軽Webスクレイピング【Google Apps Script】(cheeriogs)

Описание к видео 続・GASでお手軽Webスクレイピング【Google Apps Script】(cheeriogs)

今回は続・GASでお手軽Webスクレイピングということで、以前の動画の続編です。

前回は Parserというライブラリを使ってWebスクレイピングのプログラムを作成しました。その時の動画を見てもらえばわかるのですが、このParserというライブラリは使いにくいです。これを使うぐらいなら素直にPythonでスクレイピングのプログラムを作ったほうが良いと思うくらいに使いにくいです。

しかし最近話題となっているcheeriogsはなかなかすごいライブラリです。これを使うとpythonのbs4のように、要素を指定してその部分のみを簡単に抽出することができます。

この動画では簡単にcheeriogsの使い方を解説した後、WebスクレイピングのプログラムをGASで作ります。

--------------------------------------------------------------------------------------------------------------------------------------------
2020年12月からGASのエディターが新しいものに変わったので、解説しました。
Google Apps Script(GAS)の新しいエディターの変更点についてざっくり確認してみた【Google Apps Script】
   • 新しいエディターの変更点についてざっくり確認してみた【Google App...  
-------------------------------------------------------------------------------------
動画内で使用したテキスト検索・抽出ライブラリ
cheeriogs
https://github.com/tani/cheeriogs
-------------------------------------------------------------------------------------
過去動画です。
「GASでお手軽Webスクレイピング【Google Apps Script】」
   • GASでお手軽Webスクレイピング【Google Apps Script】  

「var, let, constの違い!?【JavaScript】」
   • var, let, constの違い!?【JavaScript】  
-------------------------------------------------------------------------------------
※Webスクレイピングは使い方によっては「偽計業務妨害罪」等の罪に問われる恐れもあります。
サイトのrobots.txtや利用規約を確認して正しく使いましょう。

Webスクレイピングの注意事項に関しては以下のサイトが参考になります。

【スクレイピングと法律】スクレイピングって法律的に何がOKで何がOUTなのかを弁護士が解説。
https://it-bengosi.com/blog/scraping/

スクレイピングは違法?スクレイピング前に注意すべきこと
https://qiita.com/ScrapeStorm-JP/item...

Webスクレイピングの注意事項一覧
https://qiita.com/nezuq/items/c5e827e...
--------------------------------------------------------------------------------------------------------------------------------------------
今後の頑張りに繋がりますので、高評価・チャンネル登録もよろしくお願いします。
↓チャンネル登録は以下のリンクからでもできます!
   / @noelrecords-programming  

ツイッターでも情報を発信しています。
  / noelrecords_app  

欲しいものリスト作ってみました。
開発環境を更新したい!!いろいろ実験してみたい!!
https://www.amazon.jp/hz/wishlist/ls/...

#プログラミング #GAS #NoelRecordsのプログラミング研究室

Комментарии

Информация по комментариям в разработке