【コンサルティング内容】
- AL理論と技法を実装(ソフトウェア化)してきた豊富な経験に基づき、実践的な技術指導
- 特に自然言語処理周りの意味理解と知識構造化理論と技術の指導
【言語処理技術】
①形態素解析
- 分ち書き処理法(N-gram、CRF、…)
- 品詞付け処理法(Viterbi、HMM、…)
- 概念タグCT付与法※
全ての形態素(助詞、副詞、助動詞…)に概念構造があります
例:Xで行った。→X=交通機関(車、電車、…)
Xへ行った。→X=目的地(会社、家、…)
②構文解析
- 文節結合(KalmanFilter、N-gram、…)
- 連文節結合(VA、HMM、…)
- 係り受け解析
係り受け関係は文節間だけでなく、形態素間、連文節間、文間にもあります。
例:SP(主部、述部)、順接(前文、後文)、逆接(前々文、該当文)
③文脈解析(照応解析)
- 照応詞特定
- 先行詞特定
先行詞は単語だけでなく、連文節や文全体に係る場合がある
例:「ここでタバコを吸ってはダメ。そのようなことはマナーの問題だ。」
そのようなこと 照応詞
④意味解析
- 文間意味タグ(関係子)付与
- 連文節間意味タグ(関係子)付与
- 文節間意味タグ(関係子)付与※
例:Causal(前々文、文)、Metaphor((鼻が、高い)、自慢)
⑤知識生成
- 独立性
- 依存性
文書から知識を抽出するにはResidueClassとCoset、Summaryが必須
例:「太陽は東から昇る。」「地球は自転をしている。」
→「地球は太陽を中心に公転している。」
⑥知識構造化(シソーラス概念+イデアル概念)
- シソーラス概念
- イデアル概念
知識は包含関係(上位/下位概念)や因果関係(依存関係)、属性などの構造化が必要
例:「家が燃えた」←「タバコの不始末」「放火」
⑦新知識生成
- 仮説検証
既存の知識から仮説生成で仮知識を生成し、検証で新知識を確定する
例:医学論文→未発見新知識「マグネシウムの欠乏で偏頭痛が起こる」
【データ処理技術】
(1)単語概念多様体:SCM(SemanticConceptualManifold)
①ジャンルG別単語概念多様体SCMM [自立語:自立語]
生成:ジャンル別単語文行列M[自立語:文]→M◦MT=SCMM
用途:トピック推定=ベクトル加法性
CT推定=Sgn((Sim(CTV,X))
同義語Synonym推定=Sgn(Sim(SentenceV,X))
類義語Resemblance推定=Sgn(Sim(SentenceV,X)) S⊂RB
関連語RelatedWord推定=Sgn(Sim(GenreV,X))
共起語Co-occuringWorde推定=Sgn(Sim(GenreV,X)) RW⊃CW
②単語ジャンル行列SCMG [自立語:ジャンル]
生成:Σ∀diag(SCMMg)=SCM
用途:文書分類推定=Sgn(<SCMG,X>) <・>:=InnerProduct
文書から特徴ベクトル抽出 視点別特徴抽出
③総合単語行列SCMT [自立語:自立語]
生成:Σ∀SCMM=SCM
用途:RIDF値抽出(ジャンル判定) 重要度の抽出
④G別文間行列SCMS [文:文]
生成:MT◦M=SCMS
用途:クラスタリング、文生成、文間の類似度
(2)G別照応解析行列SCA(Anaphora) [照応詞:先行詞]
生成:TAGGER(D)=P(Anaphora_CT,P(Antecedent_CT)
Predicate(noun_head(CT),cp)
用途:文脈解析(照応解析)、CT推定
(3)G別意味タグ行列SCT(ST) [係側:受側]
生成:ST(depend,govern)
用途:意味解析(ST自動生成)
(4)G別目的解析行列SCO(Object) [動詞:助詞]
生成:TAGGER(D)=P(Predicate,Particle)
用途:要約、主題、目的語抽出、CT推定
(5)G別因果関係行列SCC(Coherence)[動詞(結果):先行詞(原因)]
生成:TAGGER(D)=P(Predicate,Coherence(Antecedent))
用途:TAGGERの意味解析(因果関係ST付与)
(6)五感行列SCG(Senses) 連体修飾語:連体詞]、[連用修飾語:連用詞]
生成:TAGGER(D)=P(SubstantivesModifier,Substantives)
用途:感情ST(笑い、泣き、怒り、悲しみ、…)
(7)品詞列行列SCP(→PAT) [品詞BP:品詞BP]
生成:TAGGER(D)=P(BP|BP)
用途:未知語BP推定
(8)主述行列SCS(SP) [主語:述語]
生成:TAGGER(D)=P(S,P)
用途:照応解析(ゼロ代名詞)の主述推定
(9)文字列行列SCC(Character) [文字:文字]
生成:TAGGER(D)=P(C|C)
用途:未知語推定(Bi_gram,Tri_gram)
【アプリケーション技術】
〇 要約システム
☞「ズバリ要約」「SPSummary」など商品化実績があります
〇 因果関係抽出モジュール
☞新理論「因果推論」で正確な因果関係が抽出可能
〇 Chatbot/Q&A/FAQシステム
☞「問い返し/聞き返し/切り返し」やシナリオ自動作成が可能
〇 意味概念検索(曖昧検索)システム
☞大規模文書から意味タグで曖昧な横断的な検索が可能
〇 言語データに関する特殊加工技術
☞潜在的意味解析による潜在パラメータの自動抽出
〇 オントロジー自動構築技術
☞自動構築技術で柔軟で自由な多視点階層的知識が使える
〇 シソーラス辞書自動構築技術
☞単語の上位/下位概念構造の自動構築技術
■ALコンサルタント料金表
契約単位/訪問回数 | 1回/月 | 2回/月 | メール対応 |
3ヶ月間契約 | 90万円 /月 | 170万円 /月 | 毎日(10時~17時) |
半年契約 | 85万円 /月 | 160万円 /月 | 毎日(10時~17時) |
年間契約 | 80万円 /月 | 150万円 /月 | 毎日(10時~17時) |
※消費税は別途になります。
※交通費等は別途請求させて頂きます。
※機材、通信料等は当方負担です。
※上記基本料金は最低金額で、コンサル内容によっては増額する場合があります。
コンサル希望については お問い合わせ ください