鬼門:フリガナ

ownCloud から Nextcloud への移行を進めている。いつも面倒なのがフリガナだ。ownCloud のアドレス帳アプリ (Contacts/OC) は t-bucchi 氏の仕事 https://petit-noise.net/blog/phonetic-name-patch-is-merged-by-owncloud-contacts/ の恩恵に与り感謝に堪えないのだが、Nextcloud のアドレス帳アプリ (Contacts/NC) では残念ながらフリガナを扱えない。まったく細かいことなのだが、極東特殊民族語にはずっとついて回る話だ。アプリの中を覗いてみたがだいぶ構成が変わっているうえ、自分は PHP や JS を使いつけておらず、それなりに手間取りそうである。

vCard は1995年に策定されたらしい。最新の規格は vCard 4.0だ。ライブラリーは Sabre/DAV などいくつかあって、4.0もサポートしている。しかしどうもアプリケーションレベルでは3.0サポートが精々のようだ。Contacts/OC のフリガナ対応も X-PHONETIC-* を用いている。

もともと、フリガナは規格に入っていない。日本では携帯電話 (ガラケー) の普及に伴いアドレス帳の交換が必要になり vCard が広く利用されるようになったが、日本人にとってはフリガナはとても大切なものであるから、各社知恵を絞った (だろう) 結果、SOUND プロパティーに格納するようになった。これは元来 μLaw などの音声データを格納するためのものだ。ふりがなと発音は異なる概念である。ガラケー業界はここにシフトJIS (正確にはたぶんコードページ932) の文字列を格納した。まだ Unicode は規格として未成熟だったからだろう。後にスマートフォンの普及に伴って Unicode (の記述方式である UTF-8) が一般的になっていく。これと前後して vCard 3.0では SORT-STRING プロパティーが用意された。RFC には “To specify the family name or given name text to be used for national-language-specific sorting of the FN and N types.” とある。特にフリガナ用ではなく、どんな氏名表記体系であっても整列用の別途の表現を収容するために用意されたものだ。これもまたフリガナではなかった。vCard 4.0では SORT-AS パラメーターが設けられ、複数の整列キーを使えるようになった。これはこれで進歩だったが、すでにApple が X-PHONETIC-FIRST-NAME, X-PHONETIC-LAST-NAME を使っていて、目下これが事実上の標準となってしまっている。

vCard 4.0のサポートを明示しているアプリケーションは意外に目にすることがない。Thunderbird + CardBook のほか eM Client が4.0対応という話もあった。実際に eM Client で vCard を出力してみると、vCard 4.0ではあるようだがフリガナは X-PHONETIC-* で表現されている。SORT-AS は N;SORT-AS=”{surname}, {givenname}”:{surname};{givenname};{middlename};{prefix};{postfix} のように用いられている。まさに整列用で正しいのだが、フリガナとしては使えない。結局、市場の多くで vCard 3.0 + X-PHONETIC-* が使われている模様である。

Sabre/DAV のドキュメントには次のような記載がある ( http://sabre.io/dav/building-a-carddav-client/#retain-full-vcards%21 ):

Our recommendation

  1. Download the vCard
  2. Retain the entire vCard and store it locally, or at least in some lossless way
  3. Parse the vCard and populate your models with the information that is relevant to you.
  4. Keep a reference to which vCard property maps to what information in the model.

これを遵守しているのか、Contacts/NC も自身が知らない X-PHONETIC-* を破壊せずにおくようだ。CardDAV サーバーとしての運用には堪えられる。

 

広告

rm の恐怖を緩和する

rm でいきなり消すのではなく ~/.Trash へ mv するという、いつもの話。よく忘れる。

ローカル ISP

長野へ引っ越してからずっとフレッツ + ASAHI ネットだったがこのところの速度低下と断絶に音を上げて ISP を変更することにした。といっても今どきは簡単な作業だ。ASAHI ネットの問題も大きいように見えるが、他所へ移っても NAT の問題は NTT のせいなので変わらないとの話を目にしていたため、フレッツの v6 オプションに加え MAP-E か DS-Lite が使えるところを軽く探した。

まず有名どころで Interlink ZOOT NATIVE が引っかかった。ここはあらゆる人手を排除しているようで、利用開始手続は NTT v6 オプション廃止 = ASAHI ネット縛りの解除にかかった時間を除けばほぼ瞬時に終わると言ってよい。DS-Lite 方式である。ひかり電話の関係で NTT から借りている HGW は外せないため、重ルーターでの接続となる。実際に接続してみるとなかなか快適だったが、残念ながらひかり電話の子機として VoIP アダプターを登録できなくなってしまった。配線パターンが変わってしまうからだ。

MAP-E であれば HGW がそのまま使える。そこで今度は MAP-E の ISP を探すと、まったく予想外に長野のローカル ISP である JANIS に行き当たった。これは農協 ISP で、県内の農協を結ぶ専用線の網を利用して ISP を始めたものらしい。驚いたが、考えてみれば農協は金融機関でもあり商社でもある。細い専用線と詐欺のような収容率で糊口をしのいできた弱小 ISP とは話が違っていたのだった。そして JANIS は日本の ADSL/VDSL や NTT ダークファイバー利用の草分けで、あの Yahoo! BB! の ADSL は JANIS からのエンジニア大量引き抜きにより可能になったそうだ。面白い。

というわけで Interlink を2週間ほど使ってみたあげくまったく彼らの責任ではないところで JANIS へ移ることを決定した。ところが JANIS の契約はウェブサイトで簡単に済ませられない。

  1. JANIS ウェブサイトで申込用紙の郵送を請求する。
  2. 翌日あたりには用紙が届く。
  3. 用紙に記入して郵送。
  4. 5日後あたりに手続が済み、接続情報を書いた紙が発送される。
  5. 届いた紙から接続情報を読み取って接続する。
  6. クレジットカード決済の申込をウェブサイト上で行う。これは紙を提出しなくてよい。
  7. 翌月あたりからクレジットカード決済が開始となる。
  8. ウェブサイト上で v6 オプションの申込を行う。
  9. 5日後あたりに MAP-E 方式での IPv6 接続が可能となり、HGW の接続状況が変化する模様。

以上の手順で MAP-E 接続が始まるまで2週間ほどかかる。Interlink では数分で終わる作業である。カードの確認も NTT 側の IPv6 オプションの代理申込可否確認も自動化されている。JANIS ではなぜこんなに時間がかかるのか。

JANIS は農協 ISP である。農協は地域金融機関である。だから営業地域が限定されているだろう。申込に郵送を挟む必要があるのは、利用者を地域限定する必要からに違いあるまい。

さて、そんな予想外の事情にたじろぎつつもなんとか IPv4 での開通がとりあえずできたので、早速スピードテストをしてみると、Google のテストでは下りが少なくとも 40Mbps、上りが少なくとも 20Mbps ほど出る。条件が良いと下りで 100Mbps も出てくる。フレッツの契約は下り最大 200Mbps だから、これなら無理に IPv6 へ変更しなくてもよいのではと思う水準だ。すばらしい。

 

史上最悪の英語政策

阿部公彦『史上最悪の英語政策—ウソだらけの「4技能」看板』のアマゾンブックレビューが賛否両極に分かれるという面白い展開になっている。
https://www.amazon.co.jp/product-reviews/4894769123

賛成派は中高生の基礎的な語学力が(それは英語に限らないのだろうが)どんどん落ちてきている点を心配している。最も深刻な(学習量=深度×時間が絶対的に不足しているという)点をなおざりにしたまま効果が疑わしい目先の商売に語学教育が利用されることに憤りを感じている。そして行政が利用した有識者会議(歌舞伎だ)における利益相反に注意を払っている。

一方反対派は本書での表現にエキセントリックな部分があることを非難しつつ「おまえは何もわかっていない」「老害」「痛みが伴うのは当然」「すでに量は十分」「対案を出せ」等を投げつける。主張の構成が驚くほどクソウヨに似ていて、目明し根性からの表出に淫している。

ありていに言えば、たかだか日本の大学に入る程度の目的で滑ったり転んだりしていてもしかたがないのだろう。そうした極度に内向きの言い争いの中で汚い商売をするしかなくなっているのが日本の現状なのかもしれない。土建族がほとんど公金横領のようなスキームで喰いつないでいる絵面と変わらない。

私は語学教育について語るべき何ほどかも持っていないが、半径10mを観察すると英語で苦しめられている人を見ると思うことがある。彼らはそもそも精読の経験に乏しい。表現を分析的に理解し表現者の心象(内心・内的世界)を再構築する技術が不足しているのかもしれない。雰囲気で理解した気分かもしれないが、それは表現者の心象と合致している保証はまったくないわけだから、理解とはいえない。発し手と受け手が互いに理解が合致していることをあえて確認せずに、つまりある種の対立を避け、馴れ合っているだけなのかもしれない。

別に精読でなくとも精聴というか表現をきわめて注意深く受け止め分析的に解釈していく経験であればよいのだが、いずれにせよインプットである。しかし昨今の強迫観念的英語論議ではアウトプットが極端に強調されている。これまでの反動という面は理解できるが、やはり赤ん坊にいますぐ流暢に話せと言っているように聞こえる。その、初期段階での豊かなインプットなしに、どうしてアウトプットが引き出せるだろうか。

学習量が少なすぎる。それは時間もさることながらやはり深度に深刻な問題があるように思う。しかし深度は計量化困難だし、深度をもたらす教師はおそらく絶対的に不足している。人材への投資とそれに応えるプロの研鑽が必要だ。この意味で日本は徹底して教育(人材投資)を軽視していると私は感じている。本書への賛成派はそれを理解しつつも解決策の不在に呻吟し、反対派はそれを理解しているのに/だけに苦し紛れの偽薬を投与しようとのた打ち回っている。そこに正統性を失いつつある文科省が乗り、愚民カルト化に魅力を感じる政治家がからめば、現状ができあがる。

一般的な理解ではこうなのだろう。――大学教員は趣味に偏った実用的でない語学を押し付けている。だが大半の学生は実務や生きた国際交流で英語を使う。だから平易な英語を流暢に喋る方が大切だ――。ところが実務で必要なのはまず中味で、次に個々の活動を支える文脈や制度、慣習への理解であり、さらに誤解やトラップを避けるための緻密な解読である。国際交流といってもいろいろなレベルがあり、しっかりした人物と付き合うにはやはり中味が要求される。ひょっとして、ペラペラ喋るが中味がなく、騙されやすい代わりにすぐに他人を裏切る、そんな人物として国際交流していきたいのだろうか。それが大人だと思っているのだろうか。さすがにそんなはずはあるまいとも思う。しかし、たとえば企業が大好きな TOEIC は、反射神経とテンプレートで「誰にでもできる」「誰でもそのように反応する」コミュニケーションを測っている。それは確かに最も低レベルで必要な技能だが、まず目標設定としては低すぎるし、そもそも「誰にでもできる」「誰でもそのように反応する」こと自体が浅ましいものだ。これらを評価する人々は、コミュニケーションとはテンプレートに記載されたパターンの順列組合せでしかなく、価値は出し抜くことでしかもたらされないと信じているのかもしれない。

micro:bit にも表現の自由を

 

a1855410c6daec1f953bfd1246b55633.jpg

深圳から Wavesharemicro:bit 用 LCD ユニット [^1] が届いた。これは1.8インチのLCDと制御回路を持つ基盤で、micro:bit の外部端子を挿入できるコネクターを備えている。LCD は160*128ドットで16ビットカラーだ。最初から micro:bit 用に作られていて、MakeCode (いわゆるブロック言語の体裁だが中味は JavaScript のスーパーセット・TypeScript のサブセットらしい) で扱えるようにライブラリーが提供されている [^2] 。早速動作確認をしてみた。全画面のリフレッシュなどは低速のようだが、複数の描画命令を出しておいて最後に実際の描画を指示するつくりになっている。描画のもたつきは感じさせずに済むようだ。文字表示も ASCII の範囲ではできるようだ。

信号線は決め打ちとなっている。外部端子全体を接続するコネクターだから問題ない。信号線の選択や出力の順序など具体的な部分はドライバーに隠蔽され、ユーザーは MakeCode 上でロジックとコンテンツに集中できるようになっている。もっともソースが開示されているので MicroPython からの出力も一応可能だろう。

これが1,800円ほどで販売されている。日本への送料は1,000円ほどかかる。汎用品 I2C 接続表示装置接続事例もあるようだが、古式ゆかしい16×2文字のモノクロ液晶では少々ものがなしい。

[^1]: https://www.waveshare.com/wiki/1.8inch_LCD_for_micro:bit
[^2]: https://github.com/waveshare/WSLCD1in8

Automagic 導入

Macrodroid は現状では高度な文字列処理ができない。HTTP GET はできるので単純な webhook で何かを起動する程度はできるが、レスポンスをパースしてデータを抽出するような真似はほぼ無理だ。Tasker や Macrodroid に類似したものとしては Automate, AutomateIt, Automagic などがある。いくつかの評判を読み、Automagic を300円で導入してみた。なかなか多機能だ。JavaScript とは少し異なる独自のスクリプト言語が使える。JSON や XML をパースする fromJSON(), executeXPathAsString() という関数がある。これで e-Stat も利用できる。

ホモ・デウス

しばらくぶりにいわゆる話題の本を買った。ハラリ「ホモ・デウス」だ。前評判は聞いていた。まだ上巻の途中だが途中なりの心象を書いておく。ずいぶん前にフランシス・フクヤマが「人間の終わり」で警告を発していたバイオテクノロジーの問題も含まれているが、やはり主な課題は計算科学、いわゆるAI問題だろう。人間と対峙すらしないデータがすべてを超越していくとき、つまり(通常の人間にとって知能は意識の一部にすぎないが)データによって意識なき知能が課題をはるかに良く解決し調和をもたらすのであれば、人間は(少なくとも旧来の人間は)存在の意味を問われざるを得ない。原著は2015年の発行である。映画では2014年に「オートマタ」「トランセンデンス」が、2013年には「her」「コングレス未来学会議」がすでに出ていて、ハラリと並行して同じ問題を捉えている。

そこで我に返って思い出すのが「日本人は勉強しない」問題だ。周囲を見ると実際勉強していない。勉強というよりも技術の進歩や変化に対する追従に過ぎないが、そんな枝葉の知識技芸も仕入れていない。基礎教養については言うまでもない。勉強しないから外界の変化もわからないので切迫感もない。ありとあらゆる怨嗟が湧きあがるがそれは措いて、いわゆるインプットが足りない問題と捉えよう。はたしてアウトプットが十分なのかどうかが問われるわけだが、インプットとアウトプットの関係は反比例や和一定の関係ではないし、「どちらでもないムダ時間」というのもあるのでさらに面倒だ。ムダ時間はスラックと呼ばれ別に意味があったりもする。インプットに注目してごく近い周囲だけに尋ねたところ、職場での総活動時間のうちインプットにかける(少なくともアウトプットのない)時間のシェアは最大10%程度で、これを超過すれば周囲の目が気になるそうだ。自分の感覚とも合致する。しかし考えてみればまったく足りないように思う。昨今の状況では総活動時間の40-50%程度をインプットに使わないと追いつかないのではないか。そして先端に行くほどインプットとアウトプットの境界は曖昧になるだろう。