構文糖衣が多い言語

C#は構文糖衣が結構多い言語です。 構文糖衣(syntax sugar)っていうのは、要するに、「定型的な長くて面倒なコードにはなるけども、原理的にはその構文がなくても全く同じ意味のコードが書ける」というような類の機能です。

例えばクエリ式がわかりやすいですが、以下の3つの式は全く同じ意味になります。

from x in data where x > 2 select x * x
data.Where(x => x > 2).Select(x => x * x)
Enumerable.Select(Enumerable.Where(data, x => x > 2), x => x * x)

ということで、C#の機能を説明するとき、結構、「こういうコードと同じ意味になります」というような文章を書くことは多いです。

特に、ここで例に挙げたクエリ式は、式 → メソッド呼び出し → 必要があれば拡張メソッドの静的メソッドへの展開 と、2段階の変換を行う機能です。 いうなれば、「2段階」構文糖衣。

構文糖衣でない文法

逆に、C#に対して後から追加された構文の全部が全部単なる構文糖衣ではなく、コンパイル結果まで覗いてみる必要のものもちらほらあります。

もちろん、C# 2.0の時のジェネリックの追加のように、.NET Frameworkのランタイム自体に手を入れることで実現した機能もあります。

一方で、「ランタイムのレベル(型システムや中間言語(IL: Intermediate Language)の仕様レベル)では元々機能としてあるけども、 C# からは使えなかったものを使えるようにした」 というような機能もいくつかあります。 代表的なのは以下の2つでしょう。

ジェネリックの変性

ジェネリックの変性(variance)は割かしわかりやすい例でしょうか。 C#上の構文糖衣でどうこうできるわけではなくて、.NETのメタデータのレベルで処理されています。

例えばC# 4.0以降で以下のようなコードを書いたとしましょう。型引数Tに、共変であることを示すout修飾子を付けています。

interface IWrapper<out T>
{
    T Value { get; }
}

逆アセンブルしてみると以下のようになっています。 ILのレベルでも、Tの前に+という記号が入っていますが、これが共変を表すフラグです。

.class interface private abstract auto ansi IWrapper`1<+ T>
{
} // end of class IWrapper`1

このフラグは、IL的には .NET 2.0の頃からありましたが、 C#からこのフラグをいじれるようになったのはC# 4.0(.NET 4と同世代)からです。

まあ、何にしても「以前のC#であればこう展開されます」的な説明はできない機能です。

参照戻り値

最近だと参照戻り値なんかもそうです。

ILって実は安全性を損なうきわどい書き方をやりたい放題で、 C#のレベルで制限を掛けて安全性を担保していることが結構あります。 参照戻り値は、

  • これまで安全性を担保するための解析がしんどかったから使えなかった、
  • C# 7では、C#コンパイラーが賢くなったからその解析ができるようになって、認められるようになった

というものなわけです。 ILはそんな安全性とか気にしないので、昔から参照戻り値を使えました。

例えば、C# 7で以下のようなコードを書いたとします。

static ref int RefMax(ref int x, ref int y)
{
    if (x >= y) return ref x;
    else return ref y;
}

コンパイル結果は以下の通り。&が参照を表す記号です。

.method private hidebysig static int32&  RefMax(int32& x,
                                                int32& y) cil managed
{
  // コード サイズ       10 (0xa)
  .maxstack  8
  IL_0000:  ldarg.0
  IL_0001:  ldind.i4
  IL_0002:  ldarg.1
  IL_0003:  ldind.i4
  IL_0004:  blt.s      IL_0008
  IL_0006:  ldarg.0
  IL_0007:  ret
  IL_0008:  ldarg.1
  IL_0009:  ret
} // end of method Program::RefMax

このコードは、.NET 1.0の頃から書けました。 もっとも、int32& (C# 7でいうref int)の戻り値を受け取る手段がなかったので、実際のところ書いてもC#からは使えないコードになります(例えばこのコードをVisual Studio 2017でコンパイルして、その結果のDLLをVisual Studio 2015から参照した場合、このメソッドはクラスのメンバー一覧情報のところに表示されません)。

ちなみに、参照に対する操作は、実のところポインターに対する操作とまったく同じになります。 例えば、以下のようなunsafeなコードを書いてみます。 ポインターになっただけで、やっていることは先ほどの参照を使ったコードとまったく同じです。

unsafe static int* RefMax(int* x, int* y)
{
    if (*x >= *y) return x;
    else return y;
}

こちらのコンパイル結果は以下のようになります。&*に変わった以外の部分は一字一句たがわず、先ほどのコードと完全に一致しています。

.method private hidebysig static int32*  RefMax(int32* x,
                                                int32* y) cil managed
{
  // コード サイズ       10 (0xa)
  .maxstack  8
  IL_0000:  ldarg.0
  IL_0001:  ldind.i4
  IL_0002:  ldarg.1
  IL_0003:  ldind.i4
  IL_0004:  blt.s      IL_0008
  IL_0006:  ldarg.0
  IL_0007:  ret
  IL_0008:  ldarg.1
  IL_0009:  ret
} // end of method Program::RefMax

ldindはload indirect (間接ロード)の略で、 ポインターや参照ごしに値を取ってくる命令です。 ポインターと参照でまったく同じ命令を使います。

おまけ: Unsafe

余談となりますが、ILを使えば、自己責任で安全でないコード書き放題だという例にも触れておきます。

今、System.Runtime.CompilerServices.Unsafeとかいう名前からしてunsafeなライブラリがあったりします。

このパッケージ中にあるUnafeクラスは、3日目に紹介したSystem.Memoryの中で使われています。 というか、元々はSystem.Memoryパッケージ内にあったコードを、これ単体で使えるだろうと切り出した結果がSystem.Runtime.CompilerServices.Unsafeパッケージです。

ソースコードも以下のGitHubリポジトリで公開されているので中身を覗いてみると…

完全にILで書かれています

ポインターと参照を相互に変換するメソッドなんかもあったりするんですが、 以下のような感じで、実はほぼ素通しです。 ロード(ldarg)して、即リターン(ret)。

.method public hidebysig static void* AsPointer<T>(!!T& 'value') cil managed aggressiveinlining
  {
        .custom instance void System.Runtime.Versioning.NonVersionableAttribute::.ctor() = ( 01 00 00 00 )
        .maxstack 1
        ldarg.0
        conv.u
        ret
  } // end of method Unsafe::AsPointer

    .method public hidebysig static !!T& AsRef<T>(void* source) cil managed aggressiveinlining
  {
        .custom instance void System.Runtime.Versioning.NonVersionableAttribute::.ctor() = ( 01 00 00 00 )
        .maxstack 1
        ldarg.0
        ret
  } // end of method Unsafe::AsRef

ちなみに、conv.u命令は、ネイティブ(CPUの種類に応じて32bitか64bitか切り替わる)符号なし整数への変換命令です。 ポインター = ネイティブ符号なし整数。