# ググりドリブン開発の振り返り用の記事です
日頃ひたすらググってコピペしての繰り返し開発をしていて、なんとなく罪悪感(?)があるので、日頃どんなことをコピペしているのか晒してみようという試みです。笑
# JavaScriptでカンマ区切りの文字列を配列に変換する
Qiitaにあった【javascript】配列と文字列の変換を参考に、まさに👇こんな感じのことを。
str = 'Spring,Summer,Fall,Winter';
ary = str.split(',');
console.log(ary);
//=>["Spring", "Summer", "Fall", "Winter"]
# JSONを扱ってたらエラーが出てしまった
自分がスクレイピングしてきて作ったJSONがイケてなかっただけなのですが、パースしたらエラー出ちゃって、ググったり、、 ちょうどスタックオーバーフローにそれっぽいSyntaxError: Unexpected token o in JSON at position 1があったのだけど、なんというかまぁ、ただデータのフォーマットのちょっとした問題の解決にエラい時間かかってしまってアレ…
# JavaScriptに疲れたのでPythonに移行した
【初心者向け】PythonでWebスクレイピングをしてみよう!手順まとめ この記事は本当に分かりやすかった。サクっと出来た。
いやー、しかし、Python久し振りに書いた(多分、大学院の卒論の時にデータをゴニョゴニョやってた時以来だから、1年半振りとか…)けど、個人的にはJavaScriptよりスッキリしてていいなぁ。。。
import requests
from bs4 import BeautifulSoup
r = requests.get("とあるsitemap.xml")
soup = BeautifulSoup(r.content, "html.parser")
for url in soup.find_all("url"):
loc = url.find("loc").string
# Pythonでも基本的なことからググっている…
例えばPython Snippetsというサイトの文字列検索系メソッド find, index, startswith, endswidthとかはもの凄く便利 😃
# が、結局スクレイピングのメンドいところって、、
そのデータはどの部分にあるのか?っていうのは、当たり前だけど、Developer Toolとか使って追いかけないと分からないしっていう。。
# 明日もPython書こうかな
そういえば、文系プログラマーのためのPythonで学び直す高校数学をだいぶ前に買って放ったらかし状態なので、手をつけてみようかな…