5つの簡単なステップでYouTubeのコメントをかき集める

ハウツー, パイソン, スクレイピング, マー0620245分で読める

youtubeのコメントをスクレイピングする方法を知ることで、簡単な分析を行い、その結果に基づいて意思決定を行うことができる。動画コンテンツ、「いいね!」、コメントのデータを収集することで、何がうまくいき、何がうまくいかなかったかをまとめて理解することができる。Data Reportalの世界的な視聴者数に関するレポートによると、ユーチューブには以下のようなものがあるという。

youtubeのコメントをスクレイピングする方法を知ることで、簡単な分析を行い、その結果に基づいて意思決定を行うことができる。動画コンテンツ、「いいね!」、コメントのデータを収集することで、何がうまくいき、何がうまくいかなかったかをまとめて理解することができる。Data Reportalの世界的な視聴者数に関するレポートによると、2022年7月のYouTubeのユーザー数は世界で24億7,600万人だという。このデータは、YouTubeが市場調査を実施する上で最も適格なプラットフォームの一つであることを明確に示している。本記事では、ユーチューブから得られるこのような幅広いデータを、ビジネスや財務の意思決定にどのように利用するかを説明する。 

目次

YouTube - 最大のエンターテインメント・プラットフォーム

番組の宣伝であれ、学生への情報提供であれ、Youtubeは多くの視聴者に伝える最良の方法です。YoutubeはGoogleに次ぐ世界第2位の検索エンジンです。Googleをはじめとする検索エンジンは動画を好む傾向にあるため、タイトル、タグ、説明文に工夫を凝らした動画をYoutubeで共有することで、検索エンジンのランキングを向上させることができます。また、動画は感情や宣伝するものの物理的な特徴を捉えるのに最適な手法であるため、動画の助けを借りてYoutubeでブランドメッセージを伝えることもできます。

YouTubeのコメントをかき集める

Youtubeスクレイピングでは、動画データ、購読、コメント、ランキング、おすすめ、広告をスクレイピングすることができます。Youtubeスクレイパーの助けを借りて、選択したYoutubeのURLページからデータをピッキングして検索をスクレイピングすることができます。チャンネル、動画、その詳細、コメントや字幕をスクレイピングできるようになり、動画データの分析に全く新しい次元が開かれました。ウェブスクレイピングを使用して、様々な言語で自動生成されたキャプションと追加されたキャプションの両方をスクレイピングすることができます。

なぜYouTubeのコメントをスクレイピングするのか?

Youtubeからデータをスクレイピングすることは、次のような理由から有用である。

  • 適切なデータの助けを借りて、ブランド言及の頻度、視聴者のリーチ、視聴者の反応を計算するのは簡単です。例えば、企業はこの便利なデータを使って、Youtubeチャンネルからの広告や紹介に対する投資収益率(ROI)を計算することができる。こうすることで、マーケティングキャンペーンを適宜拡大することができる。 
  • Youtubeスクレイピングの助けを借りて、フェイクニュースや有害または違法なコンテンツの拡散を選び出し、分析し、遅らせることができる。
  • あらゆる調査のためのデータ収集、新たなトピックやトレンドのフォロー、さらには国別、言語別、世界規模での新たなトレンドの予測も可能です。
  • より良い選択をするために、購入を検討しているサービスや製品のレビューを見つけることができます。
  • Youtubeのコメント欄は、動画のコンテンツに対する様々な反応を明らかにするユーザーの感情データで構成されています。視聴者がどのようにコンテンツに関与しているかを理解するのに非常に役立つ。しかし、Youtubeスクレイパーを使用する前に、荒らしがコメント欄の一般的な部分であることを覚えておく必要があります。したがって、否定的なコメントを正当なフィードバックとみなすことはできない。

Pythonを使ってYoutubeのコメントをスクレイピングする

Pythonを使ってYoutubeからコメントをスクレイピングするには、以下の手順を踏む必要がある。

パッケージのインストール

以下のように、Pythonコマンドを使って必要なパッケージをインポートする必要がある。

!pipinstall datakund-bot-studio
!pipinstall youtube-comment-scraper-python

必要なパッケージのインポート

次に、必要なパッケージをインポートする必要がある。

fromyoutube_comment_scraper_pythonimport*.
pdとしてpandasをインポートする

コメント欄を開く

ご希望のYoutubeビデオのリンクを開き、以下のコマンドを使用してコメント欄に移動する必要があります。

youtube.open("https://www.youtube.com/watch?v=rSDy5AdfRDI")
youtube.keypress("ページダウン")

このコマンドを実行すると、次のような出力が得られる。

YouTubeのコメントをかき集める

上記のコードを実行した後、ウェブブラウザを開き、動画を開いてください。自動的にページダウンが実行され、コメントがスクレイピングされるので、処理が終了するまで待つ必要がある。このステップにかかる時間は、動画のコメント数によって異なります。

data = [] (データ)
currentpagesource=youtube.get_page_source()
lastpagesource=''

while(True):
   if(lastpagesource==currentpagesource):
        ブレーク
        
   lastpagesource=currentpagesource
   response=youtube.video_comments()

   forcinresponse['body']:
        data.append(c)
        
    youtube.scroll()
   currentpagesource=youtube.get_page_source()

データフレームの構築

次に、重複データを削除し、リストをデータフレームに変換する。そして、データをCSVファイルにエクスポートします。

df = pd.DataFrame(data)

df = df.replace('\n',' ',regex=True)

df = df[['Comment','Likes']].drop_duplicates(keep="first") 

df.to_csv('data.csv',index=False)

以下のように、df.head()を使ってデータをチェックする。

df.head()

YouTubeからコメントをスクレイピングするためにプロキシを使う

Youtubeプロキシは、デバイスとサーバー間のデータ交換を提供する仲介サーバーです。システム管理者やインターネットサービスプロバイダのファイアウォールをバイパスすることができる間接的な接続を作成するのに役立ちます。プロキシの助けを借りて、あなたのYoutubeビデオの再生回数を増やし、より多くのコメントを得ることができます。

コマンドプロンプトを開き、次のように入力する。

$ gitclonehttps://github.com/MShawon/YouTube-Viewer.git

$ cdYouTube-Viewer

$ pip install -r requirements.txt

さらに、Google Chromeのバージョンを確認し、同じバージョンのchromedriver.exeをhttps://chromedriver.chromium.org/downloadsからダウンロードし、chromedriver_win32フォルダに入れてください。

プロキシが大量にある場合、GoodProxy.txt を使ってプロキシをフィルタリングする必要があります。その後、GoodProxy.txtをプロキシのpythonファイルに使う必要があります。

$pythonproxy_check.py

YouTubeコメントスクレイピングにプロキシが必要な理由とは?

Youtubeのプロキシを使用する理由はいくつか考えられる:

  • 通常、教育機関やオフィスのネットワークでは、管理者の要請でYoutubeが禁止されることが多い。そのため、Youtubeプロキシは禁止を回避し、アクセスを安定させるために必要です。
  • 国によっては、Youtubeのコンテンツが自国の政策に合致しないため、国家レベルでYoutubeへのアクセスを禁止している。つまり、その国ではYoutubeを利用することができない。そのため、Youtube動画のブロックを解除するには、グローバルIPアドレスを持つYoutubeプロキシプロバイダを見つける必要があります。
  • 人がデータ検索コードやツールを使って大量のデータをスクレイピングするのは、かなり難しいだろう。この問題を克服するために、膨大な量のデータのスクレイピングを可能にする高帯域幅のプロキシを採用することができる。 

よくある質問

よくある質問

1.YouTubeのコメントをスクレイピングする用途とは?
YouTubeのコメントは、マーケティング担当者や一般ユーザーが一般の人々の傾向や意見を理解するのに役立つ。ブランドに関する言及の頻度、「いいね!」、「嫌い」は、ユーザーがリーチを測定し、ビジネス上の意思決定や財務上の決断を下すのに役立つ。また、購入者は、コメントから得たデータを使って、商品を購入するかどうかを決めることができる。
2.YouTubeのコメントをスクレイピングするために必要なpythonパッケージは何ですか?
youtubeのコメントをスクレイピングするには、youtube_comment_scraper_pythonとpandasの2つのパッケージが必要だ。前者はスクレイピング処理を行い、後者はデータ分析処理を行う。
3.なぜYouTubeのコメントをスクレイピングするのにプロキシが必要なのか?
一般的に、プロキシは学校のような特定の場所でブロックされている。この制限を回避するためにプロキシが必要となる。もう一つの重要な理由はスクレイピングである。通常のコードやツールでは、膨大な量のデータを簡単にスクレイピングすることはできない。これを克服するために、私たちは、膨大な量のデータのスクレイピングをサポートできる広帯域幅を持つプロキシを使用することができます。

YouTubeコメントのスクレイピングに関する結論

Youtubeは、個人のプラットフォームを構築するのに最適な場所であり、顧客やデジタルマーケティングの調査を大量に行える場所でもある。Youtube動画のコメント欄は、人々の期待や好き嫌いについて多くの洞察を与えてくれる。Pythonを使ってYoutubeのコメントをスクレイピングすることができるが、スクレイピングする際にはプロキシを使うべきである。プロキシを使えばブロックされるのを防げるし、より的を絞った調査ができるからだ。Youtubeのスクレイピングには専用のプロキシを使うことができる。高価ですが、他のプロキシよりも安全です。

Pythonを使ってYoutubeのコメントをスクレイピングする方法についてご理解いただけたでしょうか?