複式簿記における仕訳では、必ず2つ以上の勘定科目が登場します。例えば、
(借)減価償却費100 (貸)減価償却累計額100
という仕訳には「減価償却」と「減価償却累計額」の2つの勘定科目が現れます。勘定科目を3つ以上用いる仕訳もあります。
通常、「減価償却累計額」という勘定科目は「減価償却費」の相手勘定として仕訳に現れることが多いです。
このように、勘定科目には特定の表れやすさがあります。勘定科目の表れやすさはどうやって定式化したら良いのでしょうか。
その方法の1つが共起です。
共起と共起ネットワーク
文章のなかである単語が現れたときに、別の単語も現れやすいという傾向があるとき、これを共起といいます(参考:Wikipedia)。
共起関係はネットワーク図として表すことができ、それを共起ネットワークといいます。
共起ネットワークでは、単語をノード(頂点)、単語の共起関係をエッジ(辺)として表し、共起関係の強さをエッジの濃さで表現します。
共起ネットワークの図を作成できるツールもあるようです。
【参考記事】共起ネットワーク - KH Coderによるテキストマイニング
勘定科目の共起
仕訳の勘定科目にも共起の関係にあるものがあります。
例えば「減価償却累計額」は「減価償却費」とセットで現れることが多いですし、「未払利息」は「支払利息」とセットで現れることが多いと考えられます。
勘定科目をノードとし、共起関係をエッジとして表現することで、勘定科目の共起ネットワークも描けるでしょう。
これは仕訳の有向グラフ表現(矢印簿記)ととても良く似ています。矢印簿記でも勘定科目をノードとして用います。
【参考記事】:【君の知らない複式簿記6】矢印簿記で仕訳をビジュアライズ
共起ネットワークとの違いはエッジの意味です。
矢印簿記では2つの勘定科目が同一の仕訳に含まれるときにエッジが定義され、矢印には金額という重みが付けられます。
一方、共起ネットワークのエッジは共起関係とその強さ、つまり金額ではなく勘定科目のペアの起こりやすさですので、若干意味合いが異なります。
勘定科目の共起の応用
勘定科目の共起ネットワークを考えることの意義についても考えてみましょう。
例えば、勘定科目の共起を会計監査に活かすことが考えられます。
ある期の仕訳データのなかで、共起の度合いが低い勘定科目のペアが出現したとしましょう。それはある意味「レア」な仕訳と言えます。
このような「レア」な仕訳が登場する背景には色々ありますが、原因の1つとして、経理担当者が意図して仕訳を捏造したことも考えられます。
通常の仕訳とは別に、粉飾を目的として不自然な仕訳を入力した場合、それは共起関係の薄い勘定科目として現れる可能性があります。
勘定科目の共起を考えることで、このような不自然な仕訳を察知することが可能になります。
参考文献
共起ネットワークに関する書籍はあまり多くないようです。以下の書籍は共起ネットワークの作成ツールであるKH Coderの使い方を含む、テキストマイニングに関するテキストです。