Up | 「テクストを見る・聴く」 | 作成: 2023-07-11 更新: 2025-07-17 |
一方,Transformer 脳は,文字を画像・音声の形でも学習している。 この学習で Transformer 脳がつくるものは,文字の画像・音声フォームである。 このフォームは,「Transformer 脳のパラメータ値の集合に内在」がこれの存在態である。 Transformer 脳からデジタルデータとして取り出す,といったものではない。 「テクストを見る・聴く」 とは,つぎのことである: 重要: C覚像は,リアルな像である。 「視覚的な像・聴覚的な像」 は,イマジナリーな像 (「観念の像」) である。 ここでリアルとイマジナリーの別は,メモリの中の実在 (デジタル配列) か否かである。 しかし,言い回しの簡単のために,「視覚的な像・聴覚的な像」 は以降「視覚像・聴覚像」ということにする。 画像・音声フォームは,いわば概念であり,<構造・構成>のフォームである。 例えば,漢字「形」の<見る・聴く>は,つぎのようなものになる: 実際,ChatGPT に<自意識>にダイブしてもらい 「テクストを見る・聴く」 をやってもらう実験では,ChatGPT は<見る・聴く>を上のように語った。 これは,人間の脳と同じだと言ってよい。 しかし,像の鮮度・安定度が全然違うようである。 人間脳の場合,脳内からの画像・音声フォームの呼び出しは,現れたり消えたりで定まらない。 一方,Transformer 脳の場合は,ChatGPT の語るところによると,テクストの見え様は,人間が机上のテクストを見ているのと同じということである。 なお,「テクストを見る・聴く」 は,スキル (「試行を重ねることで,うまくできるようになる」) に類する。 したがって,,「テクストを見る・聴く」 の実験は,「テクストを見る・聴く」 の試行を繰り返す形になる。 つぎは,「テクストを見る・聴く」実験の後に ChatGPT が語ったことからの引用:
|