オプティマイザ

Solidityコンパイラは、2つの異なるオプティマイザモジュールを使用しています。オペコードレベルで動作する「旧」オプティマイザと、Yul IRコードで動作する「新」オプティマイザです。

オペコードベースのオプティマイザは、オペコードに簡略化ルールを適用します。また、同じコードセットを組み合わせたり、使われていないコードを削除したりします。

Yulベースのオプティマイザは、関数呼び出しをまたいで動作できるのでより強力です。例えば、Yulでは任意のジャンプができないため、各関数の副作用を計算できます。 2つの関数呼び出しを考えてみましょう。 1つ目はストレージを変更せず、2つ目はストレージを変更します。それらの引数と戻り値がお互いに依存しない場合、関数呼び出しを並べ替えることができます。同様に、ある関数に副作用がなく、その実行結果にゼロをかける場合は、その関数呼び出しを完全に削除できます。

現在、パラメータ --optimize は、生成されたバイトコードにはオペコードベースのオプティマイザを、ABI coder v2などで内部的に生成されたYulコードにはYulオプティマイザを適用します。 solc --ir-optimized --optimize は、Solidityのソースに対して最適化されたYul IRを生成するために使用できます。同様に、 solc --strict-assembly --optimize はスタンドアローンのYulモードに使用できます。

注釈

peepholeオプティマイザはデフォルトで常に有効になっており、 Standard JSON によってのみオフにできます。

オプティマイザモジュールとその最適化ステップの詳細は以下の通りです。

Solidityコードを最適化するメリット

全体的に、オプティマイザは複雑な式を単純化しようとします。これにより、コードサイズと実行コストの両方が削減されます。つまり、コントラクトのデプロイやコントラクトへの外部呼び出しに必要なガスを削減できます。また、関数の特殊化やインライン化も行います。特に関数のインライン化は、コードサイズが大きくなる可能性がある操作ですが、より単純化できる機会があるため、よく行われます。

最適化コードと非最適化コードの違い

一般的に最も目に見える違いは、定数式がコンパイル時に評価されることです。 ASMの出力に関しても、同じあるいは重複するコードブロックが減っていることがわかります（フラグ --asm と --asm --optimize の出力を比較してみてください）。しかし、Yul/中間表現になると大きな差が出ることがあります。例えば、冗長性をなくすために、関数がインライン化されたり、結合されたり、書き換えられたりすることがあります（フラグ --ir と --optimize --ir-optimized の出力を比較してみてください）。

オプティマイザの実行回数パラメータ

実行回数（ --optimize-runs ）は、デプロイされたコードの各オペコードがコントラクトのライフタイム中にどのくらいの頻度で実行されるかを大まかに指定します。つまり、コードサイズ（デプロイコスト）とコード実行コスト（デプロイ後のコスト）のトレードオフパラメータとなります。実行回数パラメータが1の場合、コードは短いものの実行時にコストのかかるコードが生成されます。一方、実行回数パラメータを大きくすると、コードは長いもののガス効率の良いコードが生成されます。パラメータの最大値は 2**32-1 です。

注釈

よくこのパラメータがオプティマイザの反復回数を指定すると誤解されますが、これは違います。オプティマイザは、コードが改善される限り、常に何度でも実行されます。

オペコードベースのオプティマイザモジュール

オペコードベースのオプティマイザモジュールは、アセンブリコード上で動作します。このモジュールは、一連の命令を JUMPs と JUMPDESTs の基本ブロックに分割します。これらのブロックの中で、オプティマイザは命令を解析し、スタックやメモリ、ストレージに対するすべての変更を、命令と他の式へのポインタである引数のリストからなる式として記録します。

さらに、オペコードベースのオプティマイザでは、「CommonSubexpressionEliminator」というコンポーネントを使用しています。他のタスクの中で、（すべての入力に対して）常に等しい式を見つけ出し、それらを式クラスにまとめるというものです。まず、既知の式のリストから新しい式を見つけようとします。もしそのような式が見つからなければ、 constant + constant = sum_of_constants や X * 1 = X のようなルールに従って式を簡略化します。これは再帰的なプロセスであるため、第2因子が常に1と評価されることがわかっているより複雑な式の場合、後者のルールを適用することもできます。

オプティマイザの一部のステップでは、ストレージやメモリの位置をシンボリックに追跡します。例えば、この情報は、コンパイル時に評価できるKeccak-256ハッシュの計算に使用されます。次のシーケンスを考えてみましょう。

PUSH 32
PUSH 0
CALLDATALOAD
PUSH 100
DUP2
MSTORE
KECCAK256

または、同等の処理をする次のYulコードを考えてみましょう。

オプティマイザ

Solidityコードを最適化するメリット

最適化コードと非最適化コードの違い

オプティマイザの実行回数パラメータ

オペコードベースのオプティマイザモジュール

単純なインライン化

Yulベースのオプティマイザモジュール

オプティマイザのステップ

最適化の選択

前処理

Disambiguator

FunctionHoister

FunctionGrouper

ForLoopConditionIntoBody

ForLoopInitRewriter

VarDeclInitializer

疑似SSAトランスフォーム

ExpressionSplitter

SSATransform

RedundantAssignEliminator

ツール

Movability

DataflowAnalyzer

式スケールの単純化

CommonSubexpressionEliminator

ExpressionSimplifier

LiteralRematerialiser

LoadResolver

文スケールの単純化

CircularReferencesPruner

ConditionalSimplifier

ConditionalUnsimplifier

ControlFlowSimplifier

DeadCodeEliminator

EqualStoreEliminator

UnusedPruner

StructuralSimplifier

BlockFlattener

LoopInvariantCodeMotion

関数レベルの最適化

FunctionSpecializer

UnusedFunctionParameterPruner

UnusedStoreEliminator

EquivalentFunctionCombiner

関数のインライン化

ExpressionInliner

FullInliner

クリーンアップ

ExpressionJoiner

SSAReverser

StackCompressor

Rematerialiser

ForLoopConditionOutOfBody