ラムネグから一言:寝る前に読むとくだらなすぎて逆に寝れると好評なすごい適当なブログをこっちではじめてます.
スクレイピングっていうウェブページの文章や画像といった情報をプログラムで自動で収集する方法があります。goutteもそのライブラリの一つで、PHPで使えるスクレイピングライブラリとなっています。
んでこのgoutte、これはcomposerっていういろんなこういうライブラリを管理してくれる便利なサービスを通して自分の環境にインストールするんですが…、なんか今調べてみたらgoutteはgoutteでも「fabpot/goutte」と「weidner/goutte」の二種類がある。違いあるのかな、と気になりますよね。
違いはよくわからないけど
結局英語読めないんで「fabpot/goutte」と「weidner/goutte」の違いは分からずじまい。
ただ言えることは「weidner/goutte」はrequireとして「fabpot/goutte」を必要としているので、結局goutteのコア部分は「fabpot/goutte」の方なんだと思います。
「weidner/goutte」の方はさらに機能上位版?なのかもしれません。
とりあえず以前スクレイピングするときに別プロジェクトに入れてたのが調べてみると「fabpot/goutte」の方だったんで今回も「fabpot/goutte」の方でやることにしました。
まとめ
今回はphpのスクレイピング用ライブラリgoutteについて、「fabpot/goutte」と「weidner/goutte」の違いを書きたかったんですが書けなかったです。わかったことといえば、「weidner/goutte」は「fabpot/goutte」を必要としてるので、どうやらコアは「fabpot/goutte」で「weidner/goutte」はさらに拡張版っぽいって事。
「weidner/goutte」はどういう機能が増えてるんだろう…。ただ、ここらへんってただスクレイピングするためのソフトなんで、こういう所でつまづいてると先に進まないんですよね。とりあえず無視していこう。
追記
もう少し自分の環境を調べてみると、なんと以前は「fabpot/goutte」使ってて、その後なぜか「weidner/goutte」に変えてました。ただgoutteを使ってる部分のソースコードは何も変えてないのでどっちでも何の差(記述方法の差異など)もなく動いているようだ、って事がわかりました。
そしてやっぱり「weidner/goutte」を入れると依存関係が解決されて「fabpot/goutte」も入るんで、どっちもいいんじゃないかなーと思うようにしました。
【おしらせ、というか完全なる宣伝】
文体がもうぜんぜん適当すぎてあれだけどものすごい自由に書いてるブログ「檸檬だくだく」もよろしく.寝る前に読める恐ろしくくだらないやつです.
こんなにも一ミリも目を引かれないタイトルを取り扱ってます: ココア20g / ハイチュウとかってさ / なぜ米と小麦を食べようと思ったのかの謎 /