EDINET APIを使用して、全上場企業、非上場企業の有価証券報告書(訂正前)、四半期報告書(訂正前)、半期報告書(訂正前)のデータを入手し、簡易的に粉飾決算をしているかどうかが検知できるシステムを組みました。
簡易システムは、ベンフォードの法則を利用しています。非常に簡便的でありながら、それなりの検出能力があるので、費用対効果は抜群です。
全上場企業、非上場企業の報告書データのうち、決算数字を抽出し、数字の先頭の数字を数えて、その出現頻度を数える、というのが大まかな流れになります。
合計約4800社、5年分(2020年4月1日から2025年3月31日まで)のデータは分析終了しています(データ分析は、連結、個別、連結・個別合計のそれぞれで分析しています)。
EDINETのシステムに負荷をかけないようにダウンロードする配慮が必要です。全データをダウンロードするのに、最低1週間はかかると思います。
また、注意点としては、途中でアクセスが切れてしまうことがあるので、やり直しが必要になる場合が多いことです。全データを一度にダウンロードしようとするのは無謀ですので、工夫が必要です。
なお、データがベンフォードの法則に合致しているかどうかを統計的に判別するため、カイ2乗検定で一覧表として出力できるようにもしています。
解析事例




上記は、代表的な大企業をサンプルとして表示しています。ベンフォードの法則に沿っていることがわかります。
これに対して、粉飾決算でニュースになった企業をいくつか見てみます。上記と比べてみると、なんとなく違いがわかると思います。


あわせて読みたい


ベンフォードの法則(為替の影響度)
ベンフォードの法則の適用範囲は非常に広いです。 都道府県・市町村の人口分布、電気・ガス・水道等の公共料金の請求書、株価、川の長さや面積、などにも当てはまるとさ…