目次

概要

型名がなくても、メンバー名だけでその型が何をしたいものなのか十分にわかる場合があります。 このとき、むしろ、良い型名が付かない(メンバー名と重複した名前にしかならない)こともあります。

そういう場合に、「名前のない複合型」を作りたくなります。 C#には、歴史的経緯から、匿名型(anonymous type)とタプル(tuple)という2種類の「名前のない複合型」があります。

型に良い名前が付かない場合

一般的には、型にはちゃんとした名前を考えるべきです。 「型の名前だけを見れば、その型を使って何をしたいのかがわかる」というのが理想形です。 読みやすいプログラムを書くための1手法としても、「良い名前が付く単位でデータを1まとめにする」というのが非常に有効です。

しかし、常に良い名前が思いつくかというと、現実にはそうはいきません。 メンバー名だけ見ればその型が何をしたいのか十分にわかる場合、 型には良い名前が付きにくかったりします。

以下に2例ほど紹介しましょう。 それぞれ、タプルと匿名型が生まれた動機になります。

  • 多値戻り値 → タプル
  • 部分的なメンバー抜き出し → 匿名型

これらはタプル・匿名型の一番の動機ではありますが、別にこれ以外の用途でタプル・匿名型が使えないというわけではありません。

また、タプルと匿名型は似たような機能ですが、動機が異なれば実装はかなり変わります。

多値戻り値

関数を作るとき、複数の値を返したい場合があります。 例えば、「最小値、最大値、平均値を同時に求めるメソッド」があったとしましょう。

static X Measure(IEnumerable<int> items)
{
    var count = 0;
    var sum = 0;
    var min = int.MaxValue;
    var max = int.MinValue;
    foreach (var x in items)
    {
        sum += x;
        count++;
        min = Math.Min(x, min);
        max = Math.Max(x, max);
    }

    return new X(min, max, (double)sum / count);
}

この、戻り値の型Xは、どういう名前であるべきでしょう。 メソッドがメソッドなので、「最小値と最大値と平均値」みたいな名前、すなわち、MinMaxAverageとかでしょうか? Measure(計測)した結果なので、MeasureResultとかでしょうか?

どちらも、メンバー名やメソッド名を見ればわかります。 メンバー名やメソッド名と重複した名前です。 重複は後々プログラムを修正しにくくなるのであまりいいことではありません。 例えば、メソッド名をMeasureからTally(勘定、計算)に変えたくなったとします。MeasureResultTallyResultに変えないといけないでしょう。 返したい値として、個数と分散、中央値も増やしたくなったとします。CountMinMaxAverabeVarianceMedianにすべきでしょうか?

こういう場合には、「名前のない型」を認めるべきです。例えば、以下のような書き方です。

static (int min, int max, double average) Measure(IEnumerable<int> items)
{
    var count = 0;
    var sum = 0;
    var min = int.MaxValue;
    var max = int.MinValue;
    foreach (var x in items)
    {
        sum += x;
        count++;
        min = Math.Min(x, min);
        max = Math.Max(x, max);
    }

    return (min, max, (double)sum / count);
}

これで十分に、「itemsの最小値(min)、最大値(max)、平均値(average)を計って(measure)返す」という意図を書き表せています。

ちなみに、この、(int min, int max, double average)という書き方をタプルと呼びます。 この機能については「タプル」で説明します。

部分的なメンバー抜き出し

主に「データ処理」以降で説明して行きますが、 データ処理では、ある型のデータの中から、所定のメンバーだけを抜き出したいことがよくあります。

例えば、以下のようなデータがあったとします。 これは、「疑似個人情報データ生成サービス」を使って作った架空の個人情報です。

1,奥野茉奈,オクノマナ,女,0288250107,1972/05/18
2,久保敏行,クボトシユキ,男,086288618,1984/10/13
3,長瀬由美,ナガセユミ,女,0548252320,1965/09/25
4,植田良子,ウエダヨシコ,女,0954083389,1977/03/18
・・・

全データ: personal_infomation.csv

このデータを以下のような型で読み込んで使うとします。

class Person
{
    public int Id { get; }
    public string Name { get; }
    public string Kana { get; }
    public Sex Sex { get; }
    public string PhoneNumber { get; }
    public DateTime BirthDay { get; }
}

このデータ列に対して、性別・年代ごとの人数構成を調べたいとします。 C# には、グループ化するための関数(GroupBy)や、個数を調べるための関数(Count)が備わっているのでそれを使いたいと思います。

var persons = ReadAll("personal_infomation.csv").ToArray();

// 性別・年代(10年区切り)ごとに何人いるかを集計
var histgram = persons
    .GroupBy(p => new X { Sex = p.Sex, BirthDecade = p.BirthDay.Year / 10 })
    .Select(g => new Y{ Sex = g.Key.Sex, BirthDecade = g.Key.BirthDecade, Count = g.Count() })
    .OrderBy(x => x.BirthDecade)
    .ThenBy(x => x.Sex);

ここで再び命名問題です。 グループ化のキーとして使っているX型と、結果をまとめるために使っているY型は、どういう名前であるべきでしょう。 Personの一部分なのでPartOfPersonとかでしょうか?別の情報を抜き出したくなった時との区別はどうしましょう。 グループ化のキーなわけでGroupKeyとか?これも、グループ化の条件をいろいろ変えたいときは、条件ごとにGroupKeyが必要になります。 多値戻り値の時と同様、「性別と年代の組み合わせ」であれば、メンバー名(SexBirthDecade)を見れば十分に意味が分かります。

こういう場合もやはり、「名前のない型」を認めるべきです。例えば以下のような書き方です。

var persons = ReadAll("personal_infomation.csv").ToArray();

// 性別・年代(10年区切り)ごとに何人いるかを集計
var histgram = persons
    .GroupBy(p => new { p.Sex, BirthDecade = p.BirthDay.Year / 10 })
    .Select(g => new { g.Key.Sex, g.Key.BirthDecade, Count = g.Count() })
    .OrderBy(x => x.BirthDecade)
    .ThenBy(x => x.Sex);

コード全体: AnonymousTypes.cs

{ Sex = Male, BirthDecade = 195, Count = 45 }
{ Sex = Female, BirthDecade = 195, Count = 43 }
{ Sex = Male, BirthDecade = 196, Count = 117 }
{ Sex = Female, BirthDecade = 196, Count = 115 }
{ Sex = Male, BirthDecade = 197, Count = 126 }
{ Sex = Female, BirthDecade = 197, Count = 131 }
{ Sex = Male, BirthDecade = 198, Count = 140 }
{ Sex = Female, BirthDecade = 198, Count = 133 }
{ Sex = Male, BirthDecade = 199, Count = 79 }
{ Sex = Female, BirthDecade = 199, Count = 71 }

この、new { p.Sex, BirthDecade = p.BirthDay.Year / 10 }というような書き方を匿名型と言います。

まとめ

ここでは、型名を付けるに付けられない場合を2例ほど紹介しました。

  • 多値戻り値
  • 部分的なメンバー抜き出し

それぞれ、タプルと匿名型という機能がC#に入った動機にあたります。これらの機能の詳細については、別項で説明して行きます。

(書きかけ)

タプルのページができ次第リンク

匿名型もそれ用に1ページ作りたい。今: 型推論と匿名型

更新履歴

ブログ