知識は加法群

このトピックには0件の返信、1人の参加者があり、最後にprofessorにより6年、 5ヶ月前に更新されました。

0件の返信スレッドを表示中

投稿者

投稿
- 2019年2月13日 10:52 #1125
  
  professor
  キーマスター
  
  □知識は加法群□
  　知識は文(単文、複文、重文)であり、意味のある文から知識の条件を満たした文が知識として採用される。知識としての条件とは、下記に記す定義を満たすこと。すなわち、加法群としての性質を持つことである。
  １．知識の演算
  （１）定義
  １）同じ知識の加算は不変
  a＋a=a
  ２）異なる知識の加算は新知識加法性
  a+b=c 但し、a≠c、b≠c
  c =a+bはcという知識は、aとbという知識に分割可能
  ３）知識の加算は可換性可換性
  a+b=b+a
  ４）知識の三段論法とModusPonens 三段論法
  d=a+c,　e=b+c 代入すると、d=a+(e-b) d+b=a+e
  可算すると、d+e=a+b+2c=a+b+c
  （２）空知識単位
  Φ
  （３）負の知識否定や反義
  知識の否定が負の知識
  a+(-a)=Φ
  上記３）の可換性や４）の代入やの際に用いられた
  a+b=c a=c-b=c+(-b)
  （４）知識の仮説＜仮説検証＞知識の仮説検証
  知識aの仮説をa’と表す
  a’+b＝a+b これはa’=aとなり、仮説が正しい
  a’+b=cなら、a’=c+(-b)となり、cとbの否定の加算がaとなる場合は仮説が正しい
  a’+b＝?≠a+b’ これは不明
  （５）一次結合基底の加法性
  a1+a2+a3+…+an
  （６）一次従属従属性（上下層と加法性）
  a1+a2+a3+…+an=Φ これらの知識は一次従属になる
  a1=(-a2)+(-a3)+…+(-an) なぜなら、a1は左辺の否定知識で表現されるから…
  （７）一次独立独立性（イデアル）
  a1、a2、a3、…、an 各知識は他の知識の一次結合では表現できない
  ２．作用素行列の仮説検証
  （１）作用素ｆが知識ｘに作用して知識ｙを生成する
  y=fx 関数とするとy=f(x)にしたいが、ｆはｘを内包しないので… ｆ：=行列
  fx=Φ 作用素ｆがｘに対して意味を持たない場合
  （２）作用素の加算行列の加法性
  fx+gx=(f+g)x=fx+gx=gx+fx ド・モルガンの法則
  （３）恒等作用素Φ
  Φx=x 加法群の単位元
  （４）負の作用素行列の符号変換
  fx=y
  (-f)x=(-y)
  fx+(-f)x=y+(-y)=Φ
  (-f)x=(-fx)
  （５）合成作用素行列の積
  fx=y,gy=z→g(fx)=z 作用素の合成は非可換性fg≠gf
  （６）逆作用素f-1 逆行列
  f・f-1= f-1 f=Φ
  y=fx　なら、f-1y=f-1fx=Φx=x 準同型写像の「核」
  ３．知識集合の性質
  （１）知識の基底集合E={e1,…,en}と作用素集合F={f1,…,fn}からイデアル
  知識集合X=f1e1+…+fnen と表すことができる
  これを利用して、一般の知識も基底で表すことができる
  （２）一意性一意性
  異なる基底をもつ知識は、異なる知識
  x=f1e1+…+fmem
  y=fm+1em+1+…+fnen
  x≠y 意味概念ベクトルの類似度で計算
  同じ基底をもつ一つの知識の表し方は一通り
  （３）空知識からなる知識集合は空集合Φ 意味なし
  （４）知識集合Xの濃度は可算濃度可算
  有限個の基底から可算個の知識集合が構成できるのは、有限個の基底に対して可算個の作用素が適用されて
  可算個の一次結合の知識が生成できるからである。
  ４．部分集合と位相空間化知識集合の演算
  A⊂X 補集合AcもXの部分集合
  　１）A∪A=A、A∩A=A
  　２）A∪B=B∪A、A∩B=B∩A
  　３）A∪(B∪C)=(A∪B)C,A∩(B∩C)=(A∩B)∩C
  　４）A∪(B∩C)=(A∪C)∩(A∪C),A∩(B∪C)=(A∩B)∪(A∩B)
  　５）A∪(A∩B)=A,A∩(A∪B)=A
  補集合についても、ド・モルガンの法則が成り立つ以上
  ※注意※　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　□加法性でよく間違えるのが、Word2Vecという単語ベクトルどうしの加算と減算で新たな単語ベクトルが生成できるというGoogle社が提案した「王様－男＋女＝女王」という研究課題の問題である。これは分散表現という次元を下げて基底を抽出した概念ベクトルに視点やジャンルを特定して処理する研究段階の論文である。「パリ－フランス＋日本=東京」という例題でいうなら、答えの「東京」という概念ベクトルがどんな表現なのかは「分布」というベクトルで表現されているので、左辺の加減算で得たベクトルの高頻値ではなく、「東京」というベクトルとの類似度の高さで検証されるものである。応用としては、（男、女）（伯父、伯母）（息子、娘）という男女間関係のベクトルの類似性が高いことを表す性質があり、北朝鮮と中国の関係が日本にとってどのようなことなのかという高等な質問にも答えることができるなどが期待できる。また、語意の違いを「（小雨－雨）～（小利口－利口）」として表現ができたりもする。　　　　　　　　　　　　　　　　　　　　　　　　□ディープラーニングで創る単語概念ベクトルの方法は、例えば「データ」という単語の概念ベクトルは、「単語間の類似度はデータ量に比例して精度が上がる。」という文を抽出すると、入力層は、（単語、間、の、類似度、は、量、に、比例、して、精度）という前後５形態素の単語ベクトルになり、これら10個の単語ベクトルを抽出/生成し、その中に「データ」という単語が含まれる確率を求めて、それを数百回、数万回繰り返し、ベクトル化するものであるので精度はデータ量に依存される。　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　□SCMは2次Gran行列であり、one-hotベクトルの行列とは違う。加算でできるのは上位概念であり、単語なら上位語になり、単語の集合ならトピックスになる。これも「分布」なので注意すること。　　　　　　　□Word2Vecを使ったCBoW は周辺単語から単語を予測し、Skip-gramは単語から周辺単語を予測するものである。これらを大域的に包括したのがSCMである。比較的少ないデータ量で精度が期待できる最良の方法論である。
投稿者

投稿

0件の返信スレッドを表示中

このトピックに返信するにはログインが必要です。