【コンサルティング内容】

  • AL理論と技法を実装(ソフトウェア化)してきた豊富な経験に基づき、実践的な技術指導
  • 特に自然言語処理周りの意味理解と知識構造化理論と技術の指導

【言語処理技術】

①形態素解析

  • 分ち書き処理法(N-gram、CRF、…)
  • 品詞付け処理法(Viterbi、HMM、…)
  • 概念タグCT付与法※
     全ての形態素(助詞、副詞、助動詞…)に概念構造があります
    例:Xで行った。→X=交通機関(車、電車、…)
     Xへ行った。→X=目的地(会社、家、…)

②構文解析

  • 文節結合(KalmanFilter、N-gram、…)
  • 連文節結合(VA、HMM、…)
  • 係り受け解析
      係り受け関係は文節間だけでなく、形態素間、連文節間、文間にもあります。
    例:SP(主部、述部)、順接(前文、後文)、逆接(前々文、該当文)

③文脈解析(照応解析)

  • 照応詞特定
  • 先行詞特定
     先行詞は単語だけでなく、連文節や文全体に係る場合がある
    例:「ここでタバコを吸ってはダメ。そのようなことはマナーの問題だ。」
そのようなこと 照応詞

④意味解析

  • 文間意味タグ(関係子)付与
  • 連文節間意味タグ(関係子)付与
  • 文節間意味タグ(関係子)付与※
      例:Causal(前々文、文)、Metaphor((鼻が、高い)、自慢)

⑤知識生成

  • 独立性
  • 依存性
     文書から知識を抽出するにはResidueClassとCoset、Summaryが必須
    例:「太陽は東から昇る。」「地球は自転をしている。」
  →「地球は太陽を中心に公転している。」

⑥知識構造化(シソーラス概念+イデアル概念)

  • シソーラス概念
  • イデアル概念
      知識は包含関係(上位/下位概念)や因果関係(依存関係)、属性などの構造化が必要
例:「家が燃えた」←「タバコの不始末」「放火」

⑦新知識生成

  • 仮説検証
     既存の知識から仮説生成で仮知識を生成し、検証で新知識を確定する
     例:医学論文→未発見新知識「マグネシウムの欠乏で偏頭痛が起こる」

【データ処理技術】

(1)単語概念多様体:SCM(SemanticConceptualManifold)

 ①ジャンルG別単語概念多様体SCMM          [自立語:自立語]

  生成:ジャンル別単語文行列M[自立語:文]→M◦MT=SCMM 
  用途:トピック推定=ベクトル加法性
    CT推定=Sgn((Sim(CTV,X))
     同義語Synonym推定=Sgn(Sim(SentenceV,X))
     類義語Resemblance推定=Sgn(Sim(SentenceV,X))  S⊂RB
     関連語RelatedWord推定=Sgn(Sim(GenreV,X))
     共起語Co-occuringWorde推定=Sgn(Sim(GenreV,X)) RW⊃CW

 ②単語ジャンル行列SCMG                [自立語:ジャンル] 

  生成:Σdiag(SCMMg)=SCM
  用途:文書分類推定=Sgn(<SCMG,X>)  <・>:=InnerProduct
     文書から特徴ベクトル抽出      視点別特徴抽出

 ③総合単語行列SCMT                      [自立語:自立語]

   生成:ΣSCMM=SCM
  用途:RIDF値抽出(ジャンル判定)    重要度の抽出

 ④G別文間行列SCMS                        [文:文]

   生成:MT◦M=SCMS
  用途:クラスタリング、文生成、文間の類似度

(2)G別照応解析行列SCA(Anaphora)     [照応詞:先行詞]

    生成:TAGGER(D)=P(Anaphora_CT,P(Antecedent_CT)
         Predicate(noun_head(CT),cp)
  用途:文脈解析(照応解析)、CT推定

(3)G別意味タグ行列SCT(ST)             [係側:受側]

    生成:ST(depend,govern)
   用途:意味解析(ST自動生成)

(4)G別目的解析行列SCO(Object)       [動詞:助詞]

    生成:TAGGER(D)=P(Predicate,Particle) 
  用途:要約、主題、目的語抽出、CT推定

(5)G別因果関係行列SCC(Coherence)[動詞(結果):先行詞(原因)]

    生成:TAGGER(D)=P(Predicate,Coherence(Antecedent)) 
  用途:TAGGERの意味解析(因果関係ST付与)  

(6)五感行列SCG(Senses)   連体修飾語:連体詞]、[連用修飾語:連用詞]

    生成:TAGGER(D)=P(SubstantivesModifier,Substantives)
   用途:感情ST(笑い、泣き、怒り、悲しみ、…)

(7)品詞列行列SCP(→PAT)            [品詞BP:品詞BP]

    生成:TAGGER(D)=P(BP|BP)
  用途:未知語BP推定

(8)主述行列SCS(SP)                    [主語:述語]

    生成:TAGGER(D)=P(S,P)
  用途:照応解析(ゼロ代名詞)の主述推定

(9)文字列行列SCC(Character)       [文字:文字]

    生成:TAGGER(D)=P(C|C)
  用途:未知語推定(Bi_gram,Tri_gram)

【アプリケーション技術】

〇 要約システム

  ☞「ズバリ要約」「SPSummary」など商品化実績があります 

〇 因果関係抽出モジュール

  ☞新理論「因果推論」で正確な因果関係が抽出可能 

〇 Chatbot/Q&A/FAQシステム

  ☞「問い返し/聞き返し/切り返し」やシナリオ自動作成が可能 

〇 意味概念検索(曖昧検索)システム

  ☞大規模文書から意味タグで曖昧な横断的な検索が可能 

〇 言語データに関する特殊加工技術

  ☞潜在的意味解析による潜在パラメータの自動抽出 

〇 オントロジー自動構築技術

  ☞自動構築技術で柔軟で自由な多視点階層的知識が使える 

〇 シソーラス辞書自動構築技術

  ☞単語の上位/下位概念構造の自動構築技術 

■ALコンサルタント料金表

契約単位/訪問回数1回/月2回/月メール対応
3ヶ月間契約90万円 /月 170万円 /月 毎日(10時~17時)
半年契約85万円 /月 160万円 /月 毎日(10時~17時)
年間契約80万円 /月 150万円 /月 毎日(10時~17時)
 ※消費税は別途になります。 
※交通費等は別途請求させて頂きます。
※機材、通信料等は当方負担です。
※上記基本料金は最低金額で、コンサル内容によっては増額する場合があります。

コンサル希望については お問い合わせ ください