Vibe Stack とはつまり Hobby Stack のことで、私用小物アプリをホストする要素技術の意。最近はしょーもない自分専用実用品を一瞬で作れるようになったので必要性が増した。下手なスタックを選ぶと Ops が重荷になってしまう。
で、わたくし Vibe Stack は Cloud Run + Firestore + TS Server(Hono) + TS Web (Vanilla React) で行くことにしました。
ここ十年くらいは Cloud Run + Firestore + Python (Flask) + oauth-proxy + Vanilla JS だった。何がいいかというと別に良くはないが個人の都合による:
- Cloud Run = Pay as you go なので個人アプリだとほぼタダ.
- Firestore = 同じく Pas as you go.
- Python + Flask = ウェブ素人に優しい。
- oauth-proxy: 素人なのでログイン画面すら作れないんだよ!!
- Vanilla JS: 素人なので React とかわかんねーんだよ! だいたい plain HTML で足りてますからッ
という状態だったのが、エーアイの力により以下のようになった:
- TS (Hono): なんかいい具合に書いてくれる。ログイン画面も作ってくれる。Firestore も SDK で普通に使える。
- TS (Vanilla React): なんかいい具合に同上。SSR とか必要ないのとエーアイ頼みでもなお難しすぎるので Next.js はパス。
- TS は普通に JS よりいいが、以前はビルド環境とかを作るのが無理だった。今はお任せできる。言語としては static-typed python より 10x マシ。
大きな不満は Firestore で、できれば Postgres 的な SQL を書ける RDB がいいなーと思っているのだが、GCP には pay-as-you-go で安心して使える RDB がないのだった。AWS の Aurora DSQL が羨ましい。Spanner でも AlloyDB でもいいのでがんばって追従して scale-to-zero 課金のサービス作ってくださいたのむ。Cloud Run + SQLite のハックも何種類か試したが、いまいち心許せるアプローチに出会えず諦めた。
Firestore, ロックインなのはイヤだけど、単一プロジェクト内に複数データベースをつくる機能が三年くらい前に百年の時を経て実装され、私用零細アプリ乱立用途ではかなり使えるものになった。SQL ないのは、いいです。諦めます。(いつかたのむ!)
銀行のウェブサイトからPDFをダウンロード・バックアップしたいが、やたらたくさんあってかったりー・・・ということでエーアイにがんばれせてみた記録。
最初は Claude For Chrome + Claude Code を試してみた、が、銀行のサイトは denylist されていて Claude には見えなかった。しかし健気に “この JS を devtool に貼り付けて結果を教えて” とかいうので言うがままに従ったところ、まあまあ自動化できた。ダウンロードは <a download> を click() するらしい。なるほど・・・
denylist されずに触る方法はないかと考え、そういえば DevTools MCP とかいうのがあったなと試すが、頑なに Incognito かつ別プロファイルののウィンドウばかり開くので、だめ。
別に MCP なくてもあんたたちプロトコルの JSON 知ってんじゃないの・・・とやらせてみたら、今度は localhost:9222 からデータが帰ってこないという。なぜだ・・・と調べたら、去年から 実ユーザのプロファイルで 9222 は禁止されたらしい えーケチクサじゃないですか? でも最近は npm supply chain attack とかで Linux にもカジュアルにマルウェアがやってくるようになったのを思い出し、自制。
そういえば Gemini For Chrome とかあったよね? Linux でも無理やり動かせちゃう? と試したら、途中で謎の無限ループにはいり同じ PDF を何度もダウンロードしはじめたので頓挫。
というわけで結局いちばんちゃんと動いたのは Claude Code いいなり JS コピペであった。なおこのときは節約のためモデルには Sonnet を使っており、特別賢くない。一方で途中頓挫した Gemini for Chrome は Flash 3.5 で、特段アホではない。どちらかというと Gemini for Chrome は画像ベースなのが厳しく、Claude Code は DOM 相手なのがよかったのではないか。もちろん DOM だと画像の中身は見えない以上できないこともあるわけだが、アクセシビリティとか真面目にやってあるちゃんとしたサイトなら画像よりよっぽど効果的なんじゃないの?
去年 LLM にソースコードとそのコードの実行中スタックダンプを交互に渡して動作の理解を深める Code World Model なんてのがあったけど、似たような感じで DOM World Model … というと響きがよくないな。大風呂敷で Web World Model, みたいのをどこかの frontier lab にやってほしい。まあやって成果でなかったのでお蔵入りになっている可能性もある自明なアイデアではありますが、DOM の解釈は諦めないで頑張ってほしいなあ。スクレイピングだってみんな DOM じゃん?
Google I/O を見ていてわかったこととして、仕事で使わされていた Gemini はこの Flash 3.5 で、使わされていた Antigravity は 2.0 だったらしい。
ここ二週間は、仕事の内容のせいもあるが、ほとんど自分でコードを書いていない。唯一書いたのは微妙な集計が必要な Perfetto SQL で、しかも雛形を書いただけで仕上げは Gemini 任せだった。世の中から半年一年遅れではあるが仕事における Agentic Coding がようやく実用的になった。他の会社のモデルと比べてどうかは知らないが、三ヶ月前は全然使えねーとか書いているので、大した進歩である。九ヶ月前 も同様(というか、もっと悪い)。
Flash 3.5, 賢さはさておきとにかくメチャ速い。去年使わされていた 2.5 Pro は論外として、DeepSeek ・・・と比べるのもどうかと思うが DeepSeek Flash すらカタツムリみたいに見える異常な速さ。しかし値上げと組み合わせるとあっという間にカネを溶かしそうである。仕事だと気にしなくていいのだが、趣味だとどうかな・・・。
賢さも実はそこまで不満はなく、自分のマイクロマネジメントな使い方だと現状はスイートスポットに近い感じがする。もうちょっとくらい賢いとそれは望ましいが、大幅に賢くなっても人間側の能力・仕組みがついていけない。コミット単位で同僚にレビューとかしてもらってたらアムダールの法則的に律速されてしまう。もっとバーンとでかい単位で投げてエーアイとかにレビューされてハンコ押す・・・みたいにならないとエーアイ全然本気だせない。
来月は 3.5 Pro をだすとか言ってるし、まあ Pro は使わせてもらえないにせよ過去のペースから類推するに年内もう一回くらいはバージョンアップが予想されるわけで、この人間律速問題はもはやカッティングエッジな人々に限らず大企業にとってすら明白だと思うんだよね。会社の賢い人々がどう舵取りするのか見ものであります。
あと Antigravity 2.0 は普通に良い。もう CLI 不便じゃよ・・・といいつつ遊びでは引き続き Pi+DS4 を使ってまいります。ホビーでは便利さだけがすべてじゃないのでね。
CC で作っていた漢字練習プリントアプリを Pi + DS4 Pro で直してみる。なんかフツーに動くな。難しいことをやらせていないので賢さ的には問題なし。強いて言えば (token generation が) 遅いのが不満。ただ 75% 割引で激安+コードが小さいのでまったく $5 の予算が減らないのは良い。
世の中的には Qwen の評判がいいのでつついてみたいと思い調べるも、Pi 公式 provider はなくサードパーティの provider もあまり使いたくないので保留とする。
多くの中国企業は Claude を distill していると言われているが、そうだろうなーというかんじ。文体・口調が全く同じ。Gemini とかだと毛色の違いを感じるので、トレス疑惑を問われるのもやむなし。
コーディングの RL 環境作って色んなコードをガンガン書かせるとか、エンジニアリング体力(カネ・人材)が必要そうなので中国どうこう以前に小さい企業には難しいと思うのだよね。完全な素人談義ですが。一方で distill させるにもコードは書かせる必要があるので、環境づくりが下手というのは過小評価な可能性もあり、彼らは(少なくとも環境づくりは)ちゃんとやってるのかもしれない。
エーアイの書いたコードは、書かせた人以外はレビューしなくていいし、もっといえばしない方がいいと思っている。今の職場は人間レビューが必須になっているけれど、他人のエーアイコードをレビューするのって外部性バリバリで全然フェアじゃない。自分のエーアイコードをレビューさせるのも気の毒。この無神経さに慣れたくない。
目先の実現可能性はさておき、自分にとって納得できる落とし所はどのへんかと考える。
まず Super-lint としてのエーアイコードレビューは必須。現状多かれ少なかれ皆なにかしらのエーアイコードレビューは使っているので、チーム開発ならそれを標準化し、ローカルルールや価値観を埋め込んでいく。
自分のコード
という前提で、まず自分の「所有」しているコード。エーアイと、エーアイに書かせた本人がレビューしたら、第三者のレビューはなしでいいんじゃね?ゴミ化して困るのは当人なわけだから。そもそも従来のレビュアにしても、自分で書いてない他人のコードのレビューは表面的になりがち。エーアイと大差ない。労に合わない。
その当人がゴミを残しチームや会社からいなくなってしまうリスクはある。ただそれは別にエーアイに限ったことではない。ゴミのスケールが桁違いなのは事実かもしれないが、人が書いてレビューすればゴミにならないわけでもない。チームが一丸となって作り上げたゴミの山をみたことないですか。
他人のコード
他人のコードを変更するときはどうか。あるいは逆に、他人が自分の所有するコードへの変更を送り付けてきたときはどうか。所有者に強い権限を与えよう。
従来は送られてきたコードにはある程度丁寧に付き合うのが礼儀だった。組織に閉じたコードでは特に(同僚に失礼なことしないよね)。が、エーアイコードでこれをやると所有者が外部性の被害に合う。
そこで一旦この文化・不文律を捨て、 Pi Coding Agent のように 拒否をデフォルトにする。他人からのエーアイコードは「貢献」ではなく「押し付け」だという新しい常識を広める。めんどくさそうな匂いがするなら「いらないです。さようなら」でいい。所有者がチラ見でアイデアを把握したのち自分のエーアイに書き直させてもいい。とにかく「有り難いもの」という感覚を捨てる。皆で捨てる。エラいエンジニアが strategy memo とかいってバーンと明文化する。
他人のコードを頻繁に書き換えている自分のような人間にとってはかなり不都合な世界だが、仕方ないと思う。コードを書くことより、コードの後ろにいる人間を説得するのに労力を割けということだろう。というか書いてないからなコード。エーアイが書いてるわけで。
コードは読まない→なにを読む?
この世界に「チーム共有コード」のようなものはない。すべてのコード片は誰かが所有する。そして人々は助け合わず、自分の身を守ることを優先する。楽しくない。この世界に楽しさを取り戻すには何らかの発明が必要。「オープンソース」や「コードの共同所有」は発明だった。同じようになにかが発明されないといけない。
具体的な発明の姿は見えないが、世の過激派の主張を見ると「コードは誰もレビューしない」勢力が今は一番元気に見える。Pandas の作者 Wes McKinney に至ってはエーアイレビューツールを自作し「もう全然コード読んでないよ」と言っていた。自分のコードを書いてないし、読んでない。
過激派が目指す世界では: 自分のコードは自分のエーアイレビューに任せる。他人のコードに踏み込んだら相手のコードのエーアイレビューに従う。共有コードは共有エーアイがレビュー。
進んだ先にある疑問: 人間同士はコードを読まずにどうやって「コードが実現したいこと」を伝え合うのか。この「意図」がエーアイコードの世界の「人間の読むコード」に相当するわけだが、素朴に「仕様」とか言い出すとエーアイのそれっぽい slop に侵略される。意図のやりとりでも受け手の外部性に対しては断固とした態度が必要。わかりにくい sloppy な意図はがんばって汲み取らずただ断って良い。
けれど今は人間にも「意図を伝える、明快で簡潔なコミュニケーション」すなわち anti slop が欠けている。つまり発明が必要なのは人間による読ませるコミュニケーション手法なわけだ。
個人的には「エレベーターピッチ」や「ラブレター」みたいな渾身のコミュニケーションが普通になったら面白いと思う。魂の叫びで slop に勝つ。
自分はコードを読み書きしない時代が来たら残念だけど、もし避けられないならかわりに形式的で官僚的なコミュニケーションも流れ去ってほしい。そしたら人類の進歩に数えたい。
プロジェクトの都合で自動化の仕事を手伝っている。Python と自社 DSL (Jsonnet みたいなもの) を書く仕事で、アプリの Kotlin にくらべだいぶエーアイが使える、これは Kotlin か Python あというよりコードが mess か well organized かの違いだと思われる。つまり自動化のチームは優秀でコードベースがよく整理されているのでエーアイも仕事がしやすいように見える。あとはまあ、仕事の内容が本質的に boilerplatey でエーアイ向けという面もある。
そんな boilerplate Python や DSL には愛着がないのでじゃんじゃん書かせる。が、我ながら slop を量産してる自覚がある。いや気をつけてるんですけど、自分で書かないとどうしても雑になるのだよ・・・。
気がついたこととして、コミットメッセージはコード以上に slop 感がある。あの情報量のない感じ、あるじゃん?しかも second language なせいかどうしても文質への感度が低い。一方でエーアイが書いたという事実を隠すのも気が引ける。
そこでエーアイに書かせたあと"From human:" というセクションを手書きで追記し、追加の文脈を生の人間の声として添えることにした。ハーネスとかがきちんとしていればそういうハイレベルなお役立ち情報も生成させられるのだろうか。自分の実力は全然及んでいない。
こんな罪悪感も一時的なものなのだろうけれど、通過儀礼ということで。
というわけで Pi のために検索コマンドをつくってあげました。Pi で: omo/asq
感想:
- Pi
- 全然機能がないが、それでもわりかしコード書けるので不思議。Flask の開発者が二番目の開発者として噛んでるらしいけど、きみこういうの好きそうねーというかんじ。
- ただし plan-mode は必要。いきなり突撃されると困る。
- 検索はそこそこ必要だった。モデル名とか API の詳細とか調べるため。「おまえが今開発してるバイナリで調べてご覧」とかいってリマインドした。
- いろいろカスタマイズしたい気持ちはあるが、まあぼちぼち。
- DeepSeek v4:
- OpenRouter 経由だと異常に遅かったので DeepSeek Platform で課金。プライバシー心配じゃない? というかもしれないがゴミオープンソース遊びしかしてないので。
- 賢さ。自分のように micromanage で長時間一撃稼働はさせない使い方 + 極小コードベースだと Pro は普通に使えて拍子抜け。
- Flash はアホだが単純コーディングには使える。デバッグとかは全然だめ。とりあえず Flash に書かせてみて、駄目そうなら早めに諦め Pro にするという方針でやってる。
- Flash は安いが token の無駄が多い。Pro は高いが無駄 token が少ない、気がする。しかも高くない。これ全部作るのに $0.5. 現在激安セール中のせいもあるかもだが。
- といった判断が、Thinking が全部見える(見えているはず)おかげでできるのは良い。Claude Code だとそのへん隠れているので。というか Claude の API も簡略思考しか返してないはずだよね。Flash のアホさも、思考が見えるとかわいいもんです. “Wait, … actually, … no wait” とか延々やってる。
- ただふと Gemini Flash と比べてみたら DS4 Flash は遅い! これが Huawei TPU の現実か。GPU いっぱいもってるアメリカの会社がホストしてくれるといいのだが、それだとこんなに安くないかもな。
- 作ったコマンド
- 割と便利なのでは?とおもったが人間なら普通にブラウザで調べるほうがはえーわ・・・。エーアイはこれでがんばってください。
- LLM フロントエンドなので、結果のテストの方法を考えたい気がしている。大げさに言うと eval が必要。
- Rust
- もう自分 Rust 勉強しなくていいのでは、という気持ちになる。気のせいだが。
- Serde が超便利でびっくり。
というわけでウェブ検索の不在を埋めた今、なんか他に作るものないかな。
そしてこんな小規模コードベース+ セール中 DeepSeek だと全くカネがかからなくて良い。今のところトークン尽きる心配ゼロである。
Pi Coding Agent をつかってみる日記。
動機は 1) 最近大手の coding agent がきな臭い。2) 自分は micromanage なので超高性能モデルいらないのでは、と疑っている。 3) 中華モデルためしてみたい 4) 中二病 といったところです。
オープンソースの agent ではこの pi を見かけることが増えてきたため、採用。モデル業者は色々試したいので OpenRouter, あと比較目的で Gemini (AI Sutidio).
とりあえず hello world として Rust の CLI でなんかつくってみようかと stub を作らせてみる。モデルは、安いやつを探すというゴールから DeepSeek 4 Flash.
First impression.
- コードは書ける。ただし遅い。単純に token throughput が低い。Gemini Flash 速かったな・・・。
- インターネットサーチが使えないのは厳しそうに見える。
というわけでインターネットを使わせてあげたい。色々な skill/cli/MCP が用意されている。Pi にも brave-search というスキルがある。このスキルは Brave の API を使って検索し、結果のページを Readability で strip して返すというものらしい。
サーチは frontier model が内蔵しているサーチを使えればいいのでは?と調べてみると、Pi はそういうモデル組み込みツールをサポートしていない。する気もないらしい。まあサーバサイドにループを移されると Pi のようなサードパーティの agent は滅んでしまうので、違う路線を応援したい気持ちはわからないでもない。
世の中のオープンソースの skills/cli を探すと、まあ色々ある。たとえば Brave 公式も自社 API 向け skills を公開している。が、 SKILLS.md を除いてみると単に API の仕様が書いてあるだけ。自分が使いたいような安いモデルには認知不可高すぎじゃね? CLI もあったが JSON をダンプするので駄目。
人気のあるサードパーティの定番ないのかな・・・考えていたがふと気づく: これ pi で自作してみたらいいのでは?
やりたいこと: Pi のエーアイが CLI で使えるウェブサーチ、というか、Stack Overflow 的に API の質問に答えてくれるコマンド。Brave Answers API を叩くのと、Gemini の grounding つきを叩くのと、両方サポートするかんじにしよう。言語は(なんの根拠もなく)Rust で。
OpenClaw の土台になったことで知名度急上昇中の Pi coding agent, CONTRIBUTING.md が興味深い。
All issues and PRs from new contributors are auto-closed by default.
Issues submitted Friday through Sunday are not reviewed.
俺の気に入ったバグだけ直してやんよ、という姿勢。PR についても同様で、かつ以下のような下りがある:
Using AI to write code is fine. Submitting AI-generated slop without understanding it is not.
不躾で横柄ともいえるが、エーアイ負荷で GitHub 自体すらダウンしがちな昨今、人間もこのくらいの流量制限がちょうどいいようにも思える。実際のトラッカー上でのやりとりにしても態度は一貫している。
大企業の OSS プロジェクトにもしばしば「一定時間活動がないと Issue を閉じる bot」が住んでおり、実質的にはこれと同じことをしている。体面のために設けられていた「一定時間」がなくなったと見れば良い。
GitHub の “social coding” によって大きく敷居の下がったオープンソース参加も、再び昔のような・・・かどうかはわからないが、殺伐とした世界に戻っていくのだろうか。残念なような気もするし、知らないふりをしていただけで overdue だったような気もするね。
なお Pi の開発者 Mario Zechner は最近 Pragmatic Engineer podcast でインタビューをうけていた。
インストールした。LTS だけついてく派です。
わりと普通に動いている。NVIDIA GPU でも Wayland になったらしい。この日が来ようとは・・・。あとは、なぜか Webcam も動いている。一瞬タッチパッドの動かない瞬間があったため 秘蔵の workaroundの出番かとおもったが、再起動したら直った。
Copilot 以降 Windows 11 の shitification が各地で話題になっているのを横目に Ubuntu は平和。Mac OS もいいかなとたまに思うけど、今更乗り換えるのもめんどくさいので Linux で生きていきます。二年毎にそんな決心をアップデートしている。ただ XPS とは縁を切りたいなあ。
Framework | Introducing Framework Laptop 13 Pro
欲しい。かつてこんな欲しいラップトップがあっただろうか? Framework 16 も一瞬ほしかったが、画面がサイズの割に低解像だったり建付けが悪いと評判だったりで、結局 Dell を買ってしまった。
しかしこの XPS17, クソデカでかさばるのだよねー画面がでかいのはいいんだけど。あと Linux サポートが偶然頼みで心配。XPS 13 Dev Ediition とか出してた頃は応援してたんだけどねえ。
そんな中 Framework. 前から気になっており、前に知り合いに 13 (non-pro) の実物を見せてもらったのだが 1) Dell とくらべどうしても安っぽい 2) バッテリーはそんなにもたないらしい という評価から踏み切れなかった。
しかしこの Pro は! そのどちらも解決してそうじゃないですか!! しかも Ubuntu Certified じゃないですか!!! かつて XPS 13 Dev Edition がそうであったように!!!!
しかもしかも、Intel の新しい CPU はなぜかバッテリー持つらしいじゃん?全然信じられないんだけど Framework に限らず Panther Lake 妙に評判よくない?どうした Intel? TSMC に手伝ってもらったのが良かったのか?
というわけでほしいんですよねー Framework Pro 13.
本来なら review が出揃ってから判断したいところだが、1) 既にバックログが8月出荷まで伸びている 2) 待ってるうちに RAM にあわせまた値上がりしそう。
などという懸念があり、もうすぐにでも注文したいんですよ!
でも今の XPS17 二年前に買ったばっかりで、ぶっちゃけ十分新しいのだよねー・・・Framework 応援したいんだけどなー・・・。
(オチなし)
5/3 追記: プリオーダーしてしまった。迷ってるうちにバッチが遅れ、届くの9月かー・・・。
Antigravity で少しやる気が高まったのでちょっとコードらしいコードを書かせてみっか、と優先度低めタスクから ListenableFuture の coroutine 書き直し、というのを発掘してやらせてみる。
この特定のタスクは単一のファイルに閉じた作業で単体テストもわりかし整備されているのでイケるかもな・・・と思ったが、ダメだった。
- クリーンアップ・リファクタリングなので、単純な置き換えだけでなく構造がクリーンになってほしいが、ならない。単純な置き換えも、ちょっとした障壁に邪魔されてあるべき姿にならない。レビューの往復をやっているうちに「自分で書いたほうがはえーわ・・・」という気分になった。
- ただしレビュー往復のやりやすさは antigravity 大勝利である。インラインコメントつけてsubmit とかさ、これだよこれ。CC にも欲しい。
- テストのカバレッジがあるから大丈夫なはずだが、どう見ても間違ってるコードを「テスト通りました」とかいうので「やべカバレッジ不足か・・・」とおもったら普通にコケている。お前動かしたんか?何が起きたのか謎だが、そのレベルで信用できないの困りますよ?よく考えたらきちんと trajectory をデバッグして原因を特定すべきだったかもしれない。
- いざ「自分でやるわ・・・」とやってみたら普通に難しかった。ごめんムリだったねこれは・・・。もともと「ぱっとしない L3 だとムリかな」くらいな難度のつもりだったが、思ったより元のコードがクソだったすまぬ。単一ファイルといいつつ 2000 行くらいあるしなゴミめ・・・。
- エーアイにコードを書かせながら自分は違う作業をするという算段だったが、作業の粒度が細かすぎ+出してくるコードがダメ、の組み合わせで全然「違う作業」ができなかった。我ながらマルチタスクが苦手すぎる。エーアイ向いてない。
前向きな見方としては、このエーアイ氏が Kotlin を一定程度書けることがわかったのは収穫だった。あと coroutine も表面的には理解していた。今度はもうちょっと簡単なコード書いてみようね。
久々に性能仕事。ちょっといじって、性能測って、またちょっといじって、性能測って、みたいな繰り返しが必要なのでかったりーと気が乗らなかったため、気晴らしにエーアイにやらせてみることにした。
社内にはいわゆる harness が何種類かあるが、そういえば AI pilled な同僚が Antigravity が社内コードベースにも対応してるし出来が良いですよ、と勧めてくれたのを思い出し、試してみた。結果、結構良かった。(こんなまともなアプリを作る力がまだ残っていたのかこの会社と一瞬感心したのち、そういえば acqui-hire だったのを思い出した。)
モデルのアホさはどの harness でも同じだが、 Antigravity は単純に UI の出来が良い。並列のセッションも持てるし、なにかをビルドしたり ADB を読んだりといった時間のかかる作業も非同期に動かしてチャットがブロックされないし。コードの差分を表示してる間も仕事を進めてくれるし。なので、ビルドを待ってる間に「指示マークダウン直したから読み直して」とか「集計スクリプトなおしたから再実行して」とか言える。CC も非同期で色々できるはずだが、自分が使っている範囲ではだいたいブロックするんだよな。もっと裏で色々やってくれるといいんだけど。カスタマイズが足りないのだろうか。
Antigravity とは無関係に「ちょっといじって再計測の繰り返し」という作業もエーアイに向いていた。この作業には何らクリエイティブな要素はなく、コードサーチして特定のパターンで初期化されてるところをコメントアウトする、みたいな作業。業界最先端とはいえない勤務先エーアイも、この指示は危なげなくこなした。
あと少し感心したのは、テストスクリプトの実行中に ADB の接続が切れてエラーになったとき勝手に再実行して実行を継続したこと。作業を始める前は、コードの書き換えはともかく実行と集計はスクリプトで集計できるよなあ(でもスクリプト書くのが微妙にかったるいなあ)と思っていた。しかし下手なスクリプトより出来が良い。なかなかエージェント感ある。裏で TPU を燃やしているだけある。
というかんじでエーアイ氏が微修正 -> ビルド -> テスト実行 -> 結果集計 というループを 15 ターンぐらい丸一日かけてやっている間、自分は人手コーディングを楽しんだのだった。盲点としてはテストに手元のデバイスを使わせてしまったため、自分が書いているコードを試せないことでした。明日は二台挿します。
はじめて Claude Code を触ったときは、この TUI まさか決定版なのでは という気がしたし、今でも家では TUI の Claude Code を使っているわけだが、Antigravity をさわって戻ってくるとやや残念感が芽生えてきたなあ。ターミナルで動く良さはあるし、特に自動化を考えると headless は必須ではある。ただちゃんとデスクトップ向けに UI を作ったほうがどう考えても敷居は低い。ターミナルいくつも開いて並列作業とか、やりたくないです。別に家で Antigravity/Gemini を使いたいわけではないので、first party Claude Code GUI が欲しい。
しかし自分のような Linux ユーザにそういう選択肢は無い。Claude Code Desktop の Linux 版は存在しない (実態は Electron なので謎のハックバージョンが出回ってはいるが・・・) Codex App も同様。その点 Antigravity は Linux 版もあって好ましいが ・・・ Claude Desktop は Linux 版出してくれ!たのむ!あるいは自分がターミナルいっぱい開くウェイに適応するしかないのだろうか・・・。いやですが、Linux ユーザがターミナル嫌がるとどこにも行けないのかもしれませんね・・・。
追記: これを書いた後に Claude Code, Codex のアプリが大幅刷新された。はー Linux 置いてけぼり悲しい・・・。
Pocket Casts に SearchやRecommendationsが入ってから数年たった。まあまあ便利につかってるので PSA させていただきます。
レコメンデーション。似た podcast を探せる。精度が高いとは感じないが、そもそも podcast というのはオンラインショップの商品みたいに無限にあるわけではないので、精度の高い候補はしばしば存在しない、そんな中でいちおう無関係ではない何かが表示される。ので、たまに面白そうなものがみつかる。
たとえば、エーアイ podcast 探したいなというときに Dwarkesh の隣人をチェックする、といったことが可能。たどり着くリストはウェブ検索を物色するのと大差ないが、手軽。
サーチ。気になる作家や歌手のインタビューを探して binge する使い方を主にしている。
どこかで気になる新刊書籍を見つけたら、作者のインタビューを探す。新刊の著者はだいたい宣伝ツアーをしているので、大概なにか見つかる。インタビューを聴いた結果読むに至るのは数冊に一冊程度だが、カンで選ぶより書き手の話を聴いてから選ぶほうが良い。
久しぶりに Kotlin なり Python なりにキャッチアップしようかなと podcast を探すと、やはり何かしら見つかる。
サーチは、必ずしもみつかった podcast を sub するわけではない。気になるエピソードをキューに入れておくだけ。sub しないのでやりすぎて inbox があふれる心配がない。
レコメンデーションもサーチも、アプリの中にあると敷居が低い。五年前とかはランキングくらいしかなかったので、良い時代になりました。