気まぐれにNetflixの作品一覧を取得してみようと思っている。
その過程をメモする。
ちょっとずつ進める。
気まぐれなので続くかは不明。
作る物の概要
Netflixをクローリングして動画の一覧を作る。
定期的にクローリングして一覧を更新する事ができる。
クローリングしたデータをもとにブログの記事を書いたり、何かしら視覚化するのに使う。
Netflixのアカウントが必要
Netflixではログインしないと作品のリストが見れない。
何か加工するためにリストを取得したければ、まずはNetflixのユーザー登録をして月額課金しなければならないのである。
外部サービスでNetflixの動画を探す事もできますが、まぁそれだとなんか違うのでNetflixから直接リストを得る事にする。
カテゴリ別一覧を使う
Netflixにはログインしていると見る事の出来るカテゴリごとの一覧ページが存在する。
下記を参考。
Netflixの隠れたカテゴリを直接指定して見る方法&カテゴリ別リンク一覧 - GIGAZINE
URLの後ろにカテゴリごとのIDを指定して、新着順で表示とかにするとカテゴリ内の動画一覧が表示される。
カテゴリIDのリストはどこかに保管しておくことになりそう。
リストページのHTMLを見る
HTMLをスクレイピングして動画のタイトルなど必要な部分だけを抜き出します。
リストのページのHTMLを見た感じだと、
「class="video-preload-title-label"」の値がタイトルになっているようです。
「class="video-artwork is-loaded lazy-background-image"」のstyle属性からは動画のアイコン画像が取得できそうです。
とりあえず以上。
次は動画のページからタグの情報とかが取れるか見てみるかな。