Morning Spinach: February
2023-02-15
- このところまったく朝起きられず podcast の準備が進まないので、起きたら記録をつけて自分を褒めようという試み。ついでに作業等の記録をつけるものなり。一日単位で切るのが良いのかもしれないが、とりあえずは月でまとめてみる。
- 04:05.
- 今日は論文をよむ日です。
- The History of DebitCredit and the TPC
- The Evolution of TPC Benchmarks: Why TPC-A and TPC-B are Obsolete
- Jim Gray は偉大だねー。
- 途中ですが、走りに行く時間です。
2023-02-17
- きのうは寝坊してできなかったが、Podcast 準備です。
2023-02-18
- 飛行機の搭乗に間に合わない、という悪夢で目が覚め疲労困憊。05:15.
- Podcast 準備つづき。
2023-02-20
- ハイクの疲労で起きたら五時。
- 引き続き podcast 準備。
- 終了。しかし収録は来週。
- 次なにやろうかなー・・・という前に、税金をやらねばならぬ・・・。
- 税金。終わらすぞと思うも自社株向け証券会社のやつが来ていない。しかも来月中旬まで来ないらしい。相変わらず suck である。こいつの入力が一番大変なのに・・・。大変な理由は売れる分をこまめに全部売る設定にしているからで、これをやめえばラクになるし過去十年はこれをやめた方が圧倒的に儲かったが、もうそういう時代は終わりました・・・というか自社株保持とか怖くてできません。やれやれ。まあいいです。3/14 までは no actionable items なのでなんか他のことに時間使います。
2023-02-21
- 04:35
- 考え事でもするか・・・と思ったが、その前に溜まっっている Todoist で消化できるものがないか見るべし。
2023-02-22
- 04:22
- 引き続き考え事
2023-02-23
- 04:38. 財布をなくす悪夢
2023-02-24
- 雨ですねえ。
- Accepting The Funny Mediocrity – Spinach Forest
- やりたいことを書き出してみたが、まず子の Kindergarden のサイトを crawl して写真を集めるのが最初だな、と思い至った。なぜならサ終に伴いあと一ヶ月くらいでサイトが閉鎖してしまうからです。ひどい。
- Python (Playwright) でやるか JS (Puppeteer) でやるか。Python の方が慣れてるが、Puppeteer の方が headless としては出来が良さそうなので悩ましい。良い機会だから JS/TS に入門しとくかなー。
2023-02-25
- 04:38. きのう夜ふかししてしまった...
- さて Node + TS のプロジェクトをセットアップしてみようではないか。適当にぐぐってみるべし。
- How to Setup a TypeScript + Node.js Project | Khalil Stemmler
- そもそも NVM すら入っていない・・・
- ES6 はないんじゃないかさすがに・・・
- Node Target Mapping · microsoft/TypeScript Wiki
ES2021 でよさそう。 - .gitignore も書いといてくれよ・・・
- さて puppeteer 入れましょう。
$ npm install --save-dev @types/puppeteer
npm WARN deprecated @types/puppeteer@7.0.4: This is a stub types definition. puppeteer provides its own type definitions, so you do not need this installed
- 世の中は進歩しているぞ!
- では Shutterfly のサイトにログインしてみましょう。
- この XPath 叩ける $x ってなに?どこから来てるの?とおもったら "Console utility function" なのか。べんりじゃん・・・。
- こういう便利機能もさー、たくさん devrel 雇ってるからこそ生まれるんだよわかってるかい社長さん・・・とか不景気なことを考え出すと幸福感が薄れるのでやめるべし。
- 時間切れ。
2023-02-26
- 04:30
- つづき。
- TypeScript なしに async/await なコードを書ける気がしない。Vanilla JS ヤベーな。がんばって TS にしておいてよかった・・・。
- サイトの出来が悪いのか page load 終了を安定して検出できないためしょーもない workaround を沢山いれて乗り切るが、本質的にそういう仕事です・・・。
- なにかとよくわからないページ遷移が発生するせいで Puppeteer の JS が死ぬので、かなり checkpointing を真面目にやって途中で死んでも継続できるようがんばらないといけない。時間切れ。
- 昼。妻子外出中につき継続。
- Hover すると表示されるメニューをクリックするとどこからともなく (Content-Disposition で) ダウンロードが開始されるというクソ仕様なのでどうすんだこれ・・・とおもったら Page.hover() method があるじゃん!Puppeteer すごい!
- ダウンロードとかどう処理されるのだろうか・・・とおもったが headless ブラウザなので普通にダウンロードされるらしい。ダウンロード先どこやねん、というと、裏口API を使う。なるほど・・・。
- 動いた!すごいぞ Puppeteer!
- Node.js 16: setTimeout with async/await | LinkedIn
- 古い方法で書いてしまったので後で書き直そう。
2023-02-27
- 04:25. つづきやんぞ。
- 更にいくつかの setTimeout() と retry を追加したところ、動き出した。
- とおもいきやまたコケる。そのたびに適当なワークアラウンドを足す、の繰り返しである。この retry は higher order function で書き直したいが、それよりはさっさと片付けたい気持ちが先立ってしまうな。
- しかし一日あたり 100-200+MB くらいのデータが 200 日分ある。Google Photos にアップロードしようかと思ってたけど、ちょっとでかい。そういえばむかし secon.dev で JPEG を WEBP に圧縮する話をみたな。全部おわったら真似してみよう。
- PC の auto suspend を一旦 off にしておく。そして待ってる間やることもないので Google Photos の API でも調べるか・・・。
- Library API overview | Google Photos APIs | Google Developers
- Shutterfly scraping の 10x くらいめんどくさそうだな。CLI のツールとかないだろうか・・・。と調べるとあるにはあるが、あまり手堅い様子ではないなあ。
- gphotosuploader/gphotos-uploader-cli: Command line tool to mass upload media folders to your google photos account(s) (Mac OS / Linux) これはどうかな?アップロードの仕方がドキュメントされてない・・・が、 API をたたくかったるさを考えるとこれを使うのが良さそうである。機能リストをよむと色々実装しなければいけないことがわかって尚更。そして上の secon.dev の記事もよく見ると同じツールを使っていた。
- それにしても最近のプリスクールはアプリベースのサービスを使ってるところが多いけど、それで Web UI がない日には scraping とかできなそうじゃない?どうするんだろうね。というかどうもしないのだろうけれども。
- なお学校の写真というのは別にポーズ取らせたりせず遊んだり作業したりしてるのを邪魔しないように遠くから撮ってるだけなので、そんなには面白くない。しかもつい最近まではマスク着用のため尚更である。あと割と無理にズームでよっている。電話機は Pixel 6a を使ってくれておりありがたいけれど、Pixel 7 Pro を進呈したい気になる。これは absurd でありながら過去に何度か真面目に考えたけど、もう電話機部門勤務ではなくなってしまったので、さすがにナシだな。
- 時間切れ。ダウンロードの進捗は 1/3 くらい。途中でコケ無い限り、今日中にはおわることでしょう。
- 勤務開始直前。終わってる。そして 50GB くらいあるなどうするべこれ・・・。圧縮して半分になってもちょっと Google Photos には置きたくないサイズである。気分的には 10GB くらいが budget なので、downsample して 1/5 くらいになってもらうかなあ・・・。Shutterfly がサ終したくなるのも無理はない。
2023-02-28
- 04:45. ねすごし...
- とりあえずダウンロードした写真は zip にでもして作業ディレクトリ外に避難しましょう。本来なら GCS にでも避難したいところだが、でかすぎて時間かりそうなのでまた別の機会。
- xargs で時間を溶かし、Python に避難。シェル力が低すぎる・・・てか最初から Python で書いていれば並列化とかもできただろうに・・・むしろ TS で書くべきだったか・・・。
- はーやんなっちゃうぜ時間切れ。
- しかし冷静に考えて Google Photos に 200 個以上もアルバム作っちゃうのだろうか自分。狂気なのでは。
- Delete all photos from an album from Google Photos : googlephotos そうだよねアルバム消しても写真消せないよね。やはり preschool 写真を共有目的で Photos にアップロードするのは危険すぎるな。Drive 使うほうが良いかなあ。一個くらいやってみるべきか。
- prasmussen/gdrive: Google Drive CLI Client こういうのを使うらしい。Google Drive は directory based な permission がないせいでほんとこういうの nervous でやだな・・・。
- ていうか皆様 iPhone で Mac なのだから Google Photos を経由しない時点で WEPB 使えないじゃん。終了。HEIF ... と一瞬思ったが今度は自分が見れんわ。これが first world social divide というものです。
- 覚悟を決めて 50GB をアップロードするしかない。まあ一時的なものなのでいいです・・・。
- 明日は podcast の公開作業をしなければなりません。