Chapter I

機能リストには
載らなかった
決断たち。

五つの設計決断——
それぞれに選択があり、放棄があり、
やり直したものがある。
これは VAS の手藝告白
ツールを、ツール以上にする。
01

完璧な人機協働はない——でも、完全な協働関係はある

人間とAIの協働

VAS は画面上の機密テキストを自動検出し、隠す必要のある領域を自動マークします。しかし開発中、OCR にはまだ先天的な限界があることがわかりました——時に見逃したり誤認識したりします。私たちはツールが完璧でなければならないという追求をやめました。

彼女は認識エラーをただのツールの失敗で終わらせず、協働の引き継ぎポイントにしたかった。

プライバシーモザイクをサイズ調整可能な浮動レイヤーにしました:OCR が対応できない部分は、ユーザーが手動で調整します。

認識ミスは「エラー」ではなく「分業の引き継ぎ」になります——ツールの不完全さはユーザーのコントロール権を損ないません。

OCR は自動化タスクの 90% しか完了できないかもしれませんが、手動モザイクを少しドラッグするだけで、本来 100% 手動でやるべきだったタスクを完了できます。

間違えてカバーしても大丈夫——モザイクは独立した浮動オブジェクトで、undo で一発削除できます。どんな結果も元に戻せます。

OCR 自動 できる限り認識し、機密領域を自動マーキング
モザイク補完 OCR が不十分な箇所はユーザーが手動で補う
Undo 間違えた?ワンタップで削除——取り消せない決断はない
02

QR コードを検出した——でも、どのくらい確実?

行動が意味を語る

QR コードのスキャンは表面上「検出」か「未検出」の二択に見えます。しかし VAS は違う見方をします——ユーザーの意図を読み取り、その意図に基づいて次のアクションを決めます。

これも一種の人機協働です:ユーザーはスクリーンショットの構図で意図を伝え、ツールはそれを読み取ります。言葉も、ボタンも、メニューも不要——どう切り取るかが、欲しいものの表明です。ツールが読んでいるのは命令ではなく、行動の言語です。

ユーザーが QR コードを正確に検出したいとき、選択枠内に完全かつ QR コードだけが収まるよう自然にフレーミングすると私たちは判断しました——その行為自体が意図の宣言です。選択領域に対して QR コードが占める割合が大きいほど、認識精度が上がり、信頼度が高まり、ツールはより直接的に行動できます。言葉を必要としない暗黙の了解がユーザーとツールの間に生まれます。

ツールは自分が不確かなときに確かなふりをすべきではありません。QR コードを求める意図が確かなら直接リンクを開く;信頼度が曖昧なら、リンクを開くか確認する;信頼度が低すぎるなら、静かにエディターを開いて判断を委ねる。各閾値の背後には「自分がどれだけ知っているかを知っている」という誠実な設計があります。

QR コードが選択領域に占める割合と対応する動作:
> 70% 高信頼度 · 直接行動 ページまたはリンクをすぐに開く、邪魔しない
21–69% 中信頼度 · まず確認 エディターを開いてそっと尋ねる:「これがお求めのリンクですか?」
≤ 20% 低信頼度 · サイレントハンドオフ 推測せず、行動せず、エディターを開いてあなたの次の操作を待つ
実際の操作イメージ
QR Code 截圖示意:框選越完整,辨識信心度越高
03

呼吸ライトがあなたの意図を読み取り、それから問いかける

設計でゼロフリクション

VAS の呼吸ライトは待機の象徴だけではありません——環境を感知しています。ユーザーが URL をコピーして近づくと、呼吸ライトがそっと尋ねます:「このウェブページをキャプチャしましょうか?」ユーザーが同意すれば、スクリーンショットが完了し、エディターが開きます。

ユーザーがファイルやブラウザからコピーした画像を呼吸ライトに近づけると、呼吸ライトは両腕を広げて迎えるように、ツールバーを展開してファイルを受け取り、またはすぐにエディターを起動して、ユーザーの次のアクションを待ちます。

最良のツールは「ツールモード」への切り替えを要求しません。あなたの環境に溶け込み、何をしているかを理解し、そして行動で応えます。

* 呼吸ライトによるウェブページキャプチャとコピー画像の開封は Tauri 専用機能です。Electron 版はツールバーへのドラッグ&ドロップによる画像受け取りのみ対応しています。

従来のツール思考
あなたが呼び出す → ツールが実行する
VAS のやり方
ツールが感知する → 問いかける → あなたが確認する
デザインスケッチ
呼吸燈設計手稿,以 VAS 標注完成
最終実装
呼吸燈最終實作效果
04

ポーズをとって待つ——ツールが選択のために呼び戻すべきではない

割り込みの排除

「遅延キャプチャ」を開発したことで、デュアルモニター時の全画面キャプチャで表示される Apple 純正の画面選択メニューが、逆に摩擦になりました。

遅延キャプチャはマウスイベント——エラー状態、ホバー効果、デバッグの瞬間——を捉えるために生まれた機能です。カウントダウン中、マウスは画面のどこかに留まっていなければなりません。

しかし純正のデュアルモニター選択メニューはカウントダウン終了後にツールバーから飛び出してきて、「どちらの画面をキャプチャしますか?」と選ばせます——セルフタイマーをセットしたのに、カウントダウンが終わったカメラが「どちら側を撮りますか?」と聞いてくるほど不合理です。

VAS は Apple 純正の画面選択メニューを廃止し、カスタムの全画面オーバーレイに置き換えました:遅延なしの場合はクリックした画面をキャプチャ、Enter で両画面を合成して一枚のスクリーンショットに。

さらに:ユーザーが遅延ルールを設定すると、VAS はデフォルトでマウスのいる画面をキャプチャします——選択すら不要、ツールが自動判断します。ユーザーはこの判断がバックグラウンドで行われたことすら気づきません。

原生雙螢幕選單:延遲截圖倒數期間跳出「請選擇要截哪個螢幕」
このメニューはセルフタイマー撮影で——
ポーズを決めてカウントダウンが終わってから「どちら側を撮りますか?」と聞いてくるようなものです。
VAS 自製全螢幕遮罩:延遲截圖開始前即選定螢幕
VAS の解決:遅延なしモードはクリックした画面をキャプチャ;
遅延モードは選択不要、マウスのいる画面をそのままキャプチャ。
1
遅延キャプチャ シングルモニターで遅延設定時、カウントダウン後に現在の画面を自動キャプチャ
2
カスタムオーバーレイ デュアルモニターで遅延なし時、自由に画面を選択、または Enter で全画面を一括キャプチャ
3
マウス位置デフォルト デュアルモニターで遅延設定時、選択不要——カーソルのある画面を自動でキャプチャ
05

機能は増やし続けられる——でもまず土台が同じ言語を話す必要がある

システム設計アーキテクチャ

ツールの種類が増えるにつれ——点、線、面、テキスト、シンボル——すべてのオブジェクトに色、線、サイズ、方向のプロパティがある。重複して積み重なるプロパティは、見えない技術負債になる。機能は動くが、構造は寄せ集めの車のようだ。

その決断は Sprint 9 の Retro でなされました。App Store の審査を待つあいだ、ふたりは見積もりました:4 スプリントあれば十分なはずだ、と。

4 スプリントが 17 スプリントになるとは、誰も予想していませんでした。方向が間違っていたわけではありません——ただ、一層の負債を返すたびに、その下にまた別の層が現れました。Sprint 20、Nova が手動 QC の疲弊でもう限界に近づき、ついに「自動テストがあるのになぜまだこんなに疲れているんだろう」と問いかけたとき、ふたりはようやく気づきました:テストアーキテクチャそのものが、技術負債の一部だったのです。続いて、あるユーザーが簡体字中国語への対応を求めました。実装しながら i18n の構造を見て、ふたりは言いました——これは次の言語をサポートできない——そしてまたひと巡りのリファクタリングが始まりました。Sprint 24、分厚くなった KM を開いたとき、ふとひらめきました:踏んだ穴の記録が詰まったこの帳簿を、逆に検証の地図として使えるのではないか——すべての穴が埋められたことを確かめるための。Sprint 26 が終わり、ふたりはリストを照合しました。「本当にもうないよね?」

Sprint 27、吹き出しツールが追加されました。透明度、影、グラデーション——他のツールがすでに持っていたプロパティが、ここで直接継承されました。ひとつの車輪も作り直す必要はありませんでした。それが本当の完成のサインでした。宣言ではなく、新しいツールがアーキテクチャに自然と受け入れられたその瞬間。

このリファクタリングは Electron 版にも恩恵をもたらしました——底層の統一により、両プラットフォームが同じロジックで動き、安定性が自然と向上します。

Electron は新機能を追加しなくなりましたが、機能完全・無料・安定を維持する必要があります。ユーザーが VAS を信頼し、Tauri へのアップグレードを決断する前に試す機会を与えるためです。一度のリファクタリングで、デュアルプラットフォームの長期運営戦略全体が支えられます。

リファクタリング完了——連鎖効果は予想通り
  • 座標系の統一:すべてのオブジェクトが同じ空間言語を共有
  • プロパティのモジュール化:単色/グラデーション/線スタイル/サイズ/方向がすべてのツールで通用
  • TOOL_SCHEMA が全 10 ツールをカバー、211 本の Vitest 自動テストがパス
  • 吹き出しが透明度・影・グラデーションを継承——ひとつの車輪も作り直さず
章 I · 設計 · 終
Chapter I · Design · End
II · 協作
六つの物語