今日、帰りの電車で統計の本を読んでいて、ふと、気付きました。
テーブルの列の型を決めるときに、例えば、すべての桁が数字の社員コードの場合、先頭にゼロが含まれる可能性がある場合は文字型、そうでなければINT型でも良いと思ってきたけど、考えてみれば社員コードは名義データだから算術しない故に文字型とする、という説明の方がクリアだといまさら気づいた。
— タカハシラボ (@ke_takahashi) 2019年12月10日
学生のときにSQL学んだことは無かったので、会社に入ってOracleを触るようになって、必要に迫られて必要な分だけ勉強した口です。
前職が制御系だったので、そんなに複雑なリレーションは必要とされず、フラットファイルに記録する代替手段として使っていた感じでした。
カラムの型は基本的にはコード(構造体)や画面仕様由来で決まることが多く、上記のツイートの通り格納するデータの内容からなんとなく決めていたように思います。
これは前職に限らず、以下のような書き込みもありましたので、まあ、よくある話だろうなぁと思ったわけです。
そうそう。こん感じに現場では教わるんだよね。https://t.co/IYHkuTuFhH
— タカハシラボ (@ke_takahashi) 2019年12月10日
このエントリーの出だしで書いたように、統計の本を読んでいて、ふと、ツイートのように思ったんですね。
統計もデータベースも扱うのはデータですから結びついて当然ですが、意外と関連付けて解説している記事はないのではないかと。。。思いました。
はい。