親しい友人/同僚の退職に伴い、ランチの待ち合わせや雑談に使っていた社内のチャットルームがひとつ自分を残して空になってしまった。何年もまえチャットルームを作った頃は三人いたのだが、時を経て二人ともやめてしまった。
いつからあったのかと履歴を遡ったが、一年前で途切れている。なんらかのマイグレーションに伴い履歴が消えたらしい。センチメンタルな価値すらない。
寂しさが募るばかりなのでチャットルームを削除した。職場に管を巻く相手がいないのは残念なことだが、それも人生の相かなと思う。
子どもに漢字の練習をさせるのに例文を考えるのが大変と妻が宣うので LLM にやらせてみた。使いたい漢字複数を渡すとそれをつかった例文を 10 個出す。あと例題に親近感が湧くよう、特定のキーワードもねじ込める。(たとえばマンガのキャラクタの名前とか、最近楽しかったイベントとか。)奇しくも良い LLM API 利用の習作となった。こんなかんじ:
ランダムな感想:
モデルの日本語の流暢さにはばらつきがある。Vertex AI でスッと使えるのが Gemini と Claude なのでその範囲で比べると: 1) Claude Sonnet が一番流暢で指示もよく聞く 2) Gemini Pro/Flash は大差ない (なんで?) 3) Claude Haiku は流暢だが言うことを聞かない(入れろと行った漢字を入れなかったりする。)
Vertex AI に Claude があるのは素晴らしいが ChatGPT がないのは不便(なのでサポートしてない)。お前ら仲良くしろ。
プロンプトをいじると結果は変わるが、良くなったのか悪くなったのかよくわからないことが多い。なるほど eval が大事というのはこういうことか・・・。
こうした用途で個人アプリが使う文には API は安いというか、コンシューマ用の Pro バージョン ($20/m) にカネ払うより得な気がするが、そういうもんなのだろうか。それとも月末にギョッとする?
値段。条件をきめたテキスト生成とか LLM は超得意なはずなので小さいモデルを finetune した方が軽量なのでは・・・と思うも、ウェブ向けにホストしようと思ったら結局 GPU を借りる必要があり高く付くので素のでかいモデルを API で使う方が経済的だと気づき、なんとなく虚しい。
コンシューマ向けの Chat UI のかわりに専用の画面をつけただけなのでプログラミングとしてはまったく面白くないが、有用。
複数ターンでなんかするとか RAG するとか、もうちょっとプログラミングとして面白い題材も試したくなった。
半導体産業の歴史。
軍事側の進捗の話が多いのは民間人である自分には面白い。たとえばイラン・イラク戦争でのミサイル精度はシリコンの進歩によるものだったという話など。日本もでてくるが、隆盛ののち消えていく。めちゃアメリカ視点なので、日本の半導体談義にあるような細々した話はない。それは腹立たしい気もするが、負けるというのはそうことなのだろう。
あとベイエリアすなわち「シリコンバレー」の地名が全編を通じてずーと出てくるので、住んでる人的には地元ストーリーとして読める面白さがある。え、Fairchild って Mountain View にあったの? みたいな。
最近なにかの podcast で、 OpenAI からのタレントの離反は半導体史初期の Fairchild からの離反に似ているという指摘があった。そんな歴史の一幕を振り返るのにも良い。昔から一山当ててリッチになりたい人々の土地だった。
いわゆるワーキング・プアの本 (The Working Poor という本は別にある)。ジャーナリストの著者が、取材のために本業を隠し、低賃金労働で働きながら暮らしてみる話。住居を含む生活も、その仕事からの収入だけで賄おうとする。
・・・が、賄えず何度もゲームオーバーになる。暮らせねーじゃねーか、というのが趣旨。
20 年以上前に出版された本で、以降アメリカの貧困が改善されたという話は特に聞かないので、今日どうなっているのかには興味がある。特にインターネットの普及は貧困生活者にどういう影響を与えたのだろうか。Gig Economy とか。必ずしもいい影響があったとは思わないが、何らかの影響はあるはずじゃん?
100 Best Books of the 21st Century から選んでみた一冊。
定期的に読んでしまう依存症関係の本。著者は依存症クリニックの医師で、様々な依存症エピソードが紹介されている。第一弾からしていきなり自作の自慰機械をやめられない男の話。ドギツい。意外にもインターネットや電話の話はない。
最終的には依存症脱出のガイドみたいので話が締めくくられている。方針としては Alcoholics Anonymous (AA) みたいな方向性を推しており、ああいうのってカルトというわけでもないのだなと感心を新たにする。
依存症の話が気になる人には面白い一冊。
子供にスマホ持たせんな、持たせるとしてもソーシャルメディアのアカウントを作らせんな、学校はスマホ禁止しろ、という本。大人は子供のオフラインライフには過干渉なくせにオンラインライフにゼロ干渉なのはおかしいだろう、そこの釣り合いを見直せと説く。そうですねーという感想。
めちゃ売れているらしく、ついでに California では学校から電話が ban されるらしい 。まあ学校ではいらねーだろ電話。School Shooting などの emergency のために持たせたい親が多いとリンク先の記事にはあるが、銃撃されてる子供を電話で助けられるんですかね・・・?
年金とか保険なーんもわかってねーな、ということで。なーんにもわかってない身で聞くと informative であった。ただし結構アグレッシブにいろんな金融商品を勧めており、そのへんの妥当性はあまりはっきりしない。たとえば Income Annuity とか Long-Term Care Insurance とかほんとにいるの?(後者はそのうち必要っぽいな・・・)など。
まあ知識ゼロな身として starting point にするのは良い本なのではないだろうか。Audiobook は著者自身が読んでおり、かつ著者は TV personality だったらしく、喋りに謎の力がある。そういう読みの勢いで話題の本質的な退屈さを紛らわせている。反面として関西弁のおばちゃんステレオタイプみたいな喧しさは否めないが。
定期自己啓発生産性図書。集中力ライフハック集という風情で割と良かった。Cal Newport のような micro-celebrity-cult を志向せず(きらいじゃないですけどね)実用的なのがいい。
我ながらろくでもない本しか読んでないねー・・・ろくでもなくない本は、だいたい聞き始めたあと挫折しています。
子の小学校の新学期が始まってしばらくたち、例年通り募金 (donation) のお願いがやってくる。基本的には払うことが期待されている。年間で学校に $500, 学区に $1100 が suggested donation. 学費だと思って払っている (公立です)。
さてこの学費/募金、何に使われるのだろうか。つまり、このカネがないと何が起こるのか・・・というと、音楽と図工と理科(一部)と体育(一部)がなくなります。あと遠足もなくなります。放課後の運動系クラブみたいのもなくなります。
つまり募金の集まりにくい貧乏な学区は、音楽と図工と理科一部体育一部遠足などがないわけだ。ひどくない?ビッグテック城下町とかに住まないと音楽の授業ないわけ?
しかもこの募金は非課税で、しかもしかも、会社によっては「マッチング 」といって謎の同額補助がある。自分の例でいうと、なぜか自分の子の学費(相当)に $500+$1100 = $1600 の補助がつく。
つまり Mountain View (に限らずビッグテック城下町相当地区) の小学校の授業は、裕福な父母からの募金のみならず会社からの補助金で回っているのである。同じ公立校でも、付近に太い雇用者(一般的には大企業)があるかないかで学校の授業の内容が変わる。なぜなら学費(相当)が非課税だから。そして太く雇用されているテック授業員とかほどその非課税枠を活用できるから。
クソ制度だなと思う。それよか billionare だけでなく太い雇われ会社員にもガチっと課税して所得を再分配し、田舎の貧乏な学校でも金持ち城下町の学校でもみんな音楽と図工できたほうがよくない?金持ちが非課税で自分の子にだけ楽しい授業受けさせちゃうの、いいんですかね?我々利己的な生き物なので、わざわざどこの誰とも知らない田舎の学校に募金とかしないですよ?
はーあ。公教育とはなんなのでしょうねえ。
これをクソ制度と感じる方が肩身が狭いのはわかっていて、我ながら資本主義に魂を売り切れていない Asian Communist だなと思う。でもいいです communist で。もんくあっか。(というようなことを思いながら毎年募金を上納してます。そのたびやり場のない苛立ちを感じるのでここに書いて供養するものなり。)
あわせてよみたい?
PythonとColabでできる - ゼロから作るRAW現像
本をいただいたので感想を書くというちょー久しぶりの試み。著者の大泉さんありがとうございます。
ラズパイのカメラからRAW画像 (センサから出てきた加工前非圧縮の画像)を「現像」して後処理された普通のJPEGっぽい画像にするアルゴリズムを紹介している本。
表紙に「Python と Colab でできる」と書いてあるとおり、NumPy とかを使いつつ Colab で途中経過を可視化しながら話がすすむので、テキストを読み飛ばしてもなんとなく雰囲気がわかる。なお画像アルゴリズムを開発している人も自分の知ってる範囲では似たようなことをしてます。(レガシー資産とかの都合で Matlab の方が多いかもしれない。Matlab を民主化したのが NumPy と Jupiter/Colab だからね。)
こういう「現像」のアルゴリズム、自分も基本的なことが知りたくてむかし実装してみたところがある 。その時は、本書のもとになったブログ記事を参照していた。というのも、カメラの現像アルゴリズムのまとまった資料ってびっくりするほど全然ない。これは日本語に限った話ではなく、英語でもない。世の中にはオープンソースの darktable のような現像ソフトウェアがあるのでどこかにはこういうのを開発するための資料があるのだろうけれど、素人に手が出るものは自分が調べた限りではこの本くらいしか存在しなかった。不思議。
なお自分は印刷した実物の本を頂きましたが、実用的にはページがカラーで見られる PDF 版の方が良さそう。(そもそも紙バージョンは品切れだった。商業出版じゃないかならな・・・)
画質
本書の後半にいくと、ノイズ除去やエッジ強調、モダンな demosaic のアルゴリズムなど、わりかし発展的なアルゴリズムを扱っている。こういうのを見ると、自分はカメラ開発に向いてないと思う。
個々のアルゴリズムの適応前後の画像の差は、素人目には些細なものだ。職場で回覧されてくる実際の画質改善アルゴリズムも、自分は比較画像を見るたび「たしかに寄ってじーっと見ると違うが似たようなもんじゃね・・・」と思ってしまう。
けれどそういう小さな改善の積み重ねがカメラの画像改善というもの。たくさんの改善が積み重なった結果、1-2 年はさんで画像を比べるとじっさい良くなっているので効果はある。が、この地道な作業を続けるには画質へのこだわりが必要だろうなあ。自分にはない。残念。まあ画質以外の副次的なところでお手伝いさせていただきます。
Write To Think 活動の敷居を下げるという名目で持ち運べる Bluetooth keyboard を買ってみる。キーボードを電話に繋ぐことで書き物の敷居を下げたい。自宅のラップトップはかさばるのでテーブルの↑に出しにくいし、会社のラップトップも、仕事以外ではあまりさわりたくない。
となると電話を使うのが自然だが、自分はレガシー人間で画面タイピングが遅い。そこで電話に物理キーボード。
ハードウェア
世の中のスクリーンキーボード適応が進んだ結果電話用物理ワイヤレスキーボードは需要がないらしく、気の利いた新製品は見当たらない。
買ったのはこれ。
タブレットのカバー型キーボードのようにスタンド機能を備えたものを探したが不作。仕方なくスタンドを別に持ち歩いている。折りたたみは、蓋を開いた瞬間に接続をはじめ、蓋を閉じると切れるのがわかりやすい。
なお似たような製品は山程あり、どれがいいのかはよくわからない。よくあるニッチコモディティの世界。なお、さすがに 2024 年だけあって USB-C で充電できる。評判のよい昔のモデルは Micro-USB 充電だったりするので注意。
入力
割と普通に使える。GBoard がんばってる。キーボードショートカットは、最低限はサポートされている。ただしカスタマイズはできない。たとえば Super-Key とアルファベットの組み合わせでブラウザやメールや YouTube や YT Music を起動できるが、Spotify の人はどうしたらいいのか・・・という風情。ブラウザは、さすがにデフォルトブラウザを使うようになっているのではないだろうか。試してないけど。
アプリの対応状況
文字入力はともかく他の操作がキーボードでできるアプリは少ない。GMail とか老舗なので一定程度サポートがあるし、Chrome はまあまあデスクトップ互換で動く。自分が使っている DayOne や WordPress Jetpack は「文字入力はできます以上」というかんじ。
致命的なのは Notion で、物理キーボードを有効にしていると文字入力ができない。割と Deal Breaker 気味。ワークアラウンドを模索中。
ためしに Misreading Chat の新しいエピソードを電話から公開してみた。(録音は PC.)
録音アプリ Zencastr のモバイル対応は皆無。アプリがないし、サイトもデスクトップ前提。ブラウザをデスクトップモードにしてがんばる。
ダウンロードしたステレオの MP3 をモノラルに変換するため普段は Audacity を使っているが、今回は AudioLab というアプリを使った。問題なし。
エピソードのページを WP Jetpack で書く。まあ、可能。ただ色々なリンクを書くのに普段使っている TabCopy ブラウザ拡張が使えず、超不便。これはそのうちアプリを書いた方が良い。
などの記録を Notion にちょいちょいっとつけようとしたら先に書いたバグに遭遇し使えず。やむなく DayOne に書き捨て。
Reddit への投稿は。なぜかアプリにはウェブにある機能 (リンク先のタイトル抽出) がなく、不便。しかしブラウザから普通に投稿できた。どうなんだそれは。
体感
キーボードを使いたがる動機として、タブレットや外部ディスプレイを使ったラップトップの置き換えを目論む人は多い。それは good luck という風情。一方、日記を書くくらいなら問題ない。
キーボードに手をおいて画面が少し遠い結果、無駄にアプリを切り替えることが少なくなり、書き物は捗る。あと思わぬ利点として、画面タイプより肩が凝らない。物理キーボードが肩こりにいいとは思えないが、スマホをいじる行為よりはマシらしい。対価として姿勢や場所の自由度はない。机が必要。ただ机に向かうと気が引き締まるので、純粋に欠点とは感じていない。
調べものをしながらの執筆は、可能ではあるがあまり便利でない。ただ工夫の余地はまだある印象。
画面サイズ
日記などを書くにあたって、自分が使っている電話 (Pixel 9 Pro XL) はさすがに楽勝。ただ調べ物と並列するには小さい。
ではタブレットがあればいいかと思い、そのへんに転がっていたタブレットをカバンに突っ込んでおいたが・・・使わなかった。ラップトップほどではないにせよ、デカくてかさばる。
残念ながら foldable の電話機は持っていないが、もしかしたら Foldable と BT Keyboard の組み合わせは相性がいいかもしれない。いずれ foldable を使える日が来たら試してみたい。
総体として、書く機会を増やすという目的はまあまあ達成され、買った甲斐はあった。ただ Notion で使えないのは不満なので、なんとかしたい。
ラップトップはいよいよコードを書くくらいしか使い道がなく、普段さわらない結果として今まで以上にコードが遠ざかってしまう。それも不満というか不安。Android の上でできるプログラミングについて考えたほうがいいかもしれない。