memorandums

日々の生活で問題解決したこと、知ってよかったことなどを自分が思い出すために記録しています。

同一内容を含むデータ個数をカウントしたい(問題のみ)

あるテキストファイルに以下のようなデータがあったとします。辞書順にソート済みとします。

A
A
B
B
B
C
C

このデータを入力として、以下を出力するプログラムを書く必要がありました。

A,2
B,3
C,2

プログラムじゃなくてもLinuxコマンドを組み合わせてもいいですし、Excelの機能を組み合わせてもよかったんですが。

ちなみにSQLを使えば簡単ですね。。。GROUP BYして該当行数をCOUNTすればいいですよね。。。Google DocsスプレッドシートはQueryが使えますのでテーブルを用意しなくてもExcelちっくに処理がかけそうです。

「ちょー暇」という人、初心者の方はコーディング練習にやってみてはいかがでしょうか?

ちなみに、今日の講義で使うので、教育上の配慮から、明日、解答例をアップします😁 

ちなみに講義はソフトウェア工学で、演習室でjunitのコードをgithubからcloneしてきて、修正があった(コミットメッセージにfixが含まれている)ファイルをgit logで探索し、バグ修正のあった(と思われる)ファイルリストと修正回数を抽出する前処理をする必要があります。複雑度の高いコードほど酒精回数が多いのでは?という仮説を検証する。。。という演習です。こういうバッチ的な処理を手作業でしようっていう輩はエンジニアには不向きです。「超メンドクセー、コード書けばいいんじゃね?」って言ってカタカタやりだす。。。といいなと。

では、ハッピーコーディング!