私たちの最新の TidBITS スポンサーとして Listen Later を歓迎したい。ここはウェブ上のどんな記事のテキストでもカスタマイズしたポッドキャストのエピソードに変換できる、インターネットサービスだ。変換したい記事の URL を電子メールで Listen Later に送るだけで、それほど時間もかけることなく、あなたのお気に入りのポッドキャストアプリの中に個人用 Listen Later フィードとして変換結果が登場する。
イスタンブール出身の独立系開発者 Yalim Gerger が作った Listen Later はまさに現代的な製品で、AI ツールに依存して記事のテキストを処理し口述する。その際、テキストのクリーンアップが極めて重要だ。多くの記事には広告や、画像の説明や、免責条項や、その他の余計なテキストが含まれており、滑らかな口調で語るオーディオを作るための邪魔になる。例えば、Listen Later は十分に賢くて TidBITS 記事の末尾に付くコメントをすべて除外してくれる。それからまた口述そのものも重要な点だ。その昔の Apple の Fred 音声を使った音声合成の時代から、私たちは長い道のりを進んできた。今では音声品質がとてつもなく良くなっている。
セットアップは単純だ。アカウントを作成した後に、Listen Later のメイン URL があなたの個人用ポッドキャスト URL、そのフィードに関連付けるべきアドレスのフィールド、送信先の電子メールアドレス、および利用可能なクレジットを表示する。その後は、ただ単に電子メールメッセージを送信するだけだ。メールの Subject は不要で、本文に一つ以上の URL を入れて、提供されたアドレスに宛てて送信すればよい。
私はまず Patricia Lockwood が記した 6700 語の記事 "When I Met the Pope" (ローマ教皇に会った日) を Listen Later で試してみた。今にして思えば、これはあまり良いサンプルテキストではなかった。Lockwood の文章は説明的な部分からユーモアのある部分へと軽やかに飛び回る文体だからだ。
上のスクリーンショットでご覧の通り、Listen Later はテキストをあなたが指定した言語に翻訳することもできるが、その場合には追加料金がかかる。話のついでにここで料金について触れておこう。Listen Later としては、テキストを処理して朗読するために呼び出した API コールに対して料金を、さらに翻訳もする場合にはそちらの料金も支払わなければならない。これらの料金はあなたが Listen Later に処理を依頼したテキストの量に直接に依存する。平均的な記事ならばおそらく $0.30 から $1.50 の間程度の料金がかかるだろう。 Listen Later の料金ページには推定ツールがあるので、どんな記事でもそれにどの程度の料金がかかるかの目安を得ることができる。
Listen Later は購読モデルを使わずに、使った分だけ支払う利用時払いのモデルを使っている。新規にアカウントを設定すると無料で $2 のクレジットが付くので、それを使ってサービスを試してみることができる。それを使い切れば、あなたが好きなだけの金額を補充することができる。あるいは、その種のことを考えたくもないと思う人は、残高が $0.10 を切る度に Listen Later が自動的にあなたのクレジットカードから $5 を引き出して補充するように設定しておくことも可能だ。私の感覚ではこのモデルが適切かつ透明に思えるし、購読モデルが嫌いな人にも受け入れやすいものだと思う。
一つだけ覚えておくべきことがある。Listen Later は、その名が示唆する通り、即座に結果を出す訳ではない。変換にどれくらいの時間がかかるかはその記事の長さによるし、その時点で OpenAI サーバにかかっている負荷の程度にもよる。米国におけるビジネスアワーでは負荷が高い傾向にある。私が試した長めの Patricia Lockwood 記事の場合には、Gerger から聞いた話では変換が終わるまでにおよそ 20 分ほどかかり、彼のアプリケーションに OpenAI から反応が返ってくるまでに最大 5 分ほどの待ち時間があったこともあるという。ただ、通常はあまり問題にならないはずとのことだ。そもそも Listen Later の目的は、あらかじめ記事を上げておいてから、例えば帰途の車の中で、あるいは次のワークアウトの最中に、ゆっくり聴こうというものなのだから。簡単に参照できるように、Listen Later はポッドキャストのエピソード概要欄の中に元の記事の URL を含めている。
PDF をオーディオに変換することさえできることにも気付いた。私はその機能を、Andy Weir が小説 The Martian の出版十周年を記念して最近執筆した ボーナスの章で試してみた。加えて、ついさっき Gerger は Listen Later に JPEG、PNG、および WebP フォーマットの画像の中にあるテキストもオーディオに変換できる機能を追加したと知らせてくれた。それを聞いた私は最初、そんな使い方が実際にあるだろうかと訝しく思ったが、あとで聞くと X/Twitter に PDF のスクリーンショットを投稿するのが一般的なコミュニティーがあると分かった。だから、もしそういう使い方に興味があれば、普通の記事と同じやり方で、画像への URL を Listen Later へ送ればよい。
面白いことに、この記事ではテキストをポッドキャストに変換する Listen Later について書いてきたが、同じタイミングで Apple が、ポッドキャストをテキストに変換する機能を導入している。(すぐ次の記事を参照。)生成 AI についてはさまざまの問題が山積しているけれども、生成 AI によって実現される機能のいくつかはまるで魔法のようだ。
ポッドキャストを聴くのが好きで、文章を隅から隅まで読む時間がないと思っている人には、Listen Later に新規アカウントを作って得られる無料の $2 クレジットを利用して、まず試してみることをお勧めしたい。
番組が Apple Podcasts カタログに載っていて Apple の要件を満たしている限り、書き起こし文章は自動的に生成され、新しいエピソードが登場した後で少し経てば書き起こしが利用可能になる。書き起こしの精度はかなり良いようだが、同音異義語を選んでしまうことも時々ある。例えば上のスクリーンショットでは正しい綴りの "Gene" と、同じ発音だが誤った綴りの "Jean" の両方が同じ画面に登場している。また、複数の人たちが登場するポッドキャストでも誰が話しているかは明示されない。当然予想できることだが、書き起こし文章では開く引用符と閉じる引用符が正しく使われていないことが頻繁にあった。ポッドキャスターが自身で用意した書き起こし文章を RSS 経由で提供することもできる。
Apple は古いポッドキャストについても時間をかけて書き起こしをしているところだが、Apple Podcasts カタログに 260 万以上のポッドキャストがありエピソードの総数が 9,200 万を超える (データは Daniel J. Lewis の Podcast Industry Insights による) ことを考えればそれは膨大な作業になることだろう。現時点では、英語、フランス語、ドイツ語、スペイン語の書き起こし文章のみが利用可能だ。ただし、一つの言語から別の言語への翻訳サービスはない。
EU の Digital Markets Act による変更点
EU の Digital Markets Act (デジタル市場法) によって義務付けられた iOS 17.4 の変更点がヨーロッパ在住のユーザーの日々のユーザー体験にどのような影響を与えるかを予見するのは不可能だ。(2024 年 1 月 29 日の記事“EU が壁に囲まれた Apple の庭を開放させる”参照。) またそれも、今回の変更点に不満を抱く者たちからの避け得ない異議申し立てに Apple の新しいルールが耐え得ると仮定した上での話だ。
おそらく最も重大な要件、つまり Apple が iOS アプリ購入のための代替市場を許容するという件も、間もなく登場することになる。Mac 用に Setapp 購読サービスを提供しているウクライナの会社 MacPaw は、iOS アプリ用バージョンの Setapp として Setapp Mobile を発表した。開発者が Setapp に加入する際にどんなことが変わるのかがよく分からないと私が質問したところ、MacPaw の創設者であり CEO の Oleksandr Kosovan は電子メールで次のように答えてくれた:
Apple の European Union 域内での新しいビジネス条件は、大規模で人気ある無料アプリで何百万ものインストールを抱え、別の収益化モデルを使っている開発者にとっては必ずしも望ましいものではないかもしれません。けれども、私たちのモデルはさまざまのカテゴリーのアプリ、とりわけユーザーに長期的な価値を提供しているアプリの開発者の方々の需要に完璧に応えるものです。
Setapp のモデルにおいては、一つのアプリが長期間にわたって頻繁に使われれば、開発者がさらなる収益源を得られます。新しい要件を採用することで、開発者にとってさらに利益性が増すこともあり得ます。私たちは Apple の Core Technology Fee が Setapp のビジネスモデルとどのように協調することになるかを注意深く評価しつつ、今後も小規模や中規模の開発者にとって魅力的かつ利益の多いサービスとなるように努めているところです。
iPhone 15 および iPhone 15 Pro モデルで、Battery Health 画面にバッテリーの充放電回数、製造日、最初の使用が表示される。Settings > Battery > Battery Health からアクセスできる。
Apple Cash で仮想カード番号をセットアップしておき、Apple Pay 非対応の店頭での支払いに使うことができる。おそらく対面でも、あるいは Safari AutoFill でも使えると思われる。Wallet アプリで Apple Cash カードを表示させた際にこのセットアップを促されることになる。また、右上隅にある ... ボタンをタップしてから Card Number をタップしてもセットアップのリンクにアクセスできる。
Siri に "What's playing?" と尋ねたり、あるいは Control Center で Shazam 音楽識別ボタンを使ったりして音楽を識別した後で、その結果を Apple Music の Playlists や Library、あるいは Apple Music Classical に追加できる。最初の試みで Add To ボタンが機能しなければ、Open ボタンを使ってから、タップを続けて Apple Music の welcome 画面を通り抜けるとよい。
Call Identification (発信者番号通知) が、Apple が確認した商号、ロゴ、部門名などを、利用可能な場合に表示する。私の推測だが、各企業は Apple Business Connect を通じてその確認を得るのだろう。
Messages for Business で、アップデートにより "trusted information for order status, flight notifications, fraud alerts or other transactions you opt into" を提供できる。私自身は現実世界で Messages for Business にお目にかかったことがないので、もしどなたかこれを使っている方がおられれば、どんな感じのものなのかをコメントで教えて頂ければありがたい。
Siri が「対応している言語で受信したメッセージを読み上げる」新しいオプションを追加した。このオプションがどこにあるのか、どうやってオンにするのかを発見された方はどうぞ教えて頂きたい。[訳者注: Settings > Siri & Search > Messaging with Siri にあるとのことです。]
Apple Immersive Video の視聴中に、クローズドキャプションを再生コントロールに固定出来る。
今や、ハンズフリーで Personas を登録することが出来、Apple は髪やメイクの外観、首や口がどのように表現されるかを改善することによって、不気味の谷(人間そっくりだが僅かに違う) から這い出ようとしている。同社はまた、Vision Pro の外側に表示する EyeSight 機能のユーザーの目のレンダリングを改善したと言っている。
言いたいことはお分かりだろう。これは決して3つの別々のデバイスではない。これは1つのコンピュータであって、実際には2つのコンピュータから成り、Apple エコシステムの魔法のお陰で両者が協力して働く。Mac に iPad をディスプレイとして取り付けてあり、いつでも取り外して独立のタブレット機として使えるが、この iPad はドックした状態では Mac の一部となる。そして、Vision Pro のためには理想的なキーボードとトラックパッドとして機能する。
もしもあの MacHack Conference が今も続いていたならば、きっと Federico Viticci はこのコンバーチブル・ラップトップを作り上げたハックの技を讃えて総立ちの拍手喝采を受けたことだろう。13 インチ MacBook Air のボトムケースが Mac の処理能力とキーボードとトラックパッドを提供し、11 インチ iPad Pro がスクリーンとして働くとともに独立にも動作できる。それと同時に、本体の MacBook Air は Studio Display を外付けディスプレイとして駆動することもでき、また Vision Pro の中で Mac 仮想ディスプレイとして使うこともできる。何ともまあ素晴らしい。