# Copyright (c) Microsoft Corporation.
# Licensed under the MIT License.
from __future__ import annotations

from typing import Any, Optional, Sequence

import numpy as np
import onnx
from onnx import FunctionProto, GraphProto, ModelProto, TensorProto, ValueInfoProto

import onnxscript.onnx_types
from onnxscript._internal import type_annotation

_SINGLE_INDENT = "    "

_SMALL_TENSOR_SIZE = 4

kwlist = {
    "False",
    "None",
    "True",
    "and",
    "as",
    "assert",
    "async",
    "await",
    "break",
    "class",
    "continue",
    "def",
    "del",
    "elif",
    "else",
    "except",
    "finally",
    "for",
    "from",
    "global",
    "if",
    "import",
    "in",
    "is",
    "lambda",
    "nonlocal",
    "not",
    "or",
    "pass",
    "raise",
    "return",
    "try",
    "while",
    "with",
    "yield",
}


def _get_const_repr(const_node):
    """Given an ONNX Constant-op node, returns a string representation of
    the constant-value in ONNXScript, if a compact representation is possible.
    Returns None otherwise.
    Supports only FLOAT/INT64 values and scalars and small rank-1 tensors.
    This needs to be reconciled with the ONNXScript converter.
    """
    assert const_node.op_type == "Constant", "Expected a constant node"
    attr = const_node.attribute[0]
    if not attr.HasField("t"):
        return None
    tensor_proto = attr.t
    if tensor_proto.data_type in {TensorProto.FLOAT, TensorProto.INT64}:
        rank = len(tensor_proto.dims)
        if rank == 0:
            array = onnx.numpy_helper.to_array(tensor_proto).reshape(1)  # noqa: TID251
            return str(array[0])
        if rank == 1 and tensor_proto.dims[0] < 5:
            nparray = onnx.numpy_helper.to_array(tensor_proto)  # noqa: TID251
            return repr(nparray.tolist())
    return None


def _cleanup_variable_name(name: ValueInfoProto | str) -> str:
    """Converts given name into a valid python variable names.
    Handles names that clash with python keywords and common issues seen in ONNX models:
    * Identifiers like "5" (that do not start with an alpha character)
    * Identifiers that contain a dot like "layers.0.foo"
    This is a simple heuristic, and doesn't guarantee it avoids name-clashes.
    """
    if isinstance(name, ValueInfoProto):
        # Handle graph/function input/output uniformly
        name = name.name
    assert isinstance(name, str)
    assert name != ""
    if name in kwlist:
        return f"r_{name}"
    first = name[0]
    if not (first.isalpha() or (first == "_")):
        name = f"__{name}"

    def rename_char(char):
        """Replace invalid character by underscore."""
        return char if (char.isalnum() or (char == "_")) else "_"

    return "".join([rename_char(c) for c in name])


def _make_short_name_mapper():
    """Returns a renamer used to create short new names  (like v0, v1, ...) for variables."""
    variable_names: dict[str, str] = {}

    def renamer(name):
        # TODO: simplify this. No need to use _cleanup_variable_name?
        var_name = _cleanup_variable_name(name)
        if var_name in variable_names:
            return variable_names[var_name]
        new_name = f"v{len(variable_names) + 1}"
        assert var_name is not None  # TODO(rama): This looks suspect.
        variable_names[var_name] = new_name
        return new_name

    return renamer


def _translate_type(onnx_type):
    """Converts a onnx type into a type defined by *onnxscript*."""
    return onnxscript.onnx_types.onnx_type_to_onnxscript_repr(onnx_type, reversible=False)


def _translate_signature(inputs, outputs):
    """Produce the script-functions signature."""

    def input_sig(inp: ValueInfoProto | str):
        if isinstance(inp, ValueInfoProto):
            # GraphProto inputs/outputs are ValueInfoProto
            return f"{_cleanup_variable_name(inp.name)}: {_translate_type(inp.type)}"

        # FunctionProto inputs/outputs are just strings
        return _cleanup_variable_name(inp)

    result = f"({', '.join([input_sig(x) for x in inputs])})"
    if outputs and isinstance(outputs[0], ValueInfoProto):
        result += f" -> ({', '.join([_translate_type(x.type) for x in outputs])})"
    return f"{result}:"


def _translate_value_infos(value_infos: Sequence[ValueInfoProto]) -> str:
    def _translate_value_info(value_info: ValueInfoProto) -> str:
        return f"{_SINGLE_INDENT}'{_cleanup_variable_name(value_info.name)}': {_translate_type(value_info.type)},"

    lines = [_translate_value_info(x) for x in value_infos]
    lines_joined = "\n".join(lines)
    return "{\n" + lines_joined + "\n}"


def _to_str(s):
    if isinstance(s, bytes):
        try:
            return s.decode("utf-8")
        except UnicodeDecodeError:
            pass
    return s


def _is_attribute_ref(attr: onnx.AttributeProto) -> bool:
    return attr.HasField("ref_attr_name") and attr.ref_attr_name != ""


def _attribute_value(attr: onnx.AttributeProto):
    if attr.type == onnx.AttributeProto.FLOAT:
        return attr.f
    if attr.type == onnx.AttributeProto.INT:
        return attr.i
    if attr.type == onnx.AttributeProto.STRING:
        return _to_str(attr.s)
    if attr.type == onnx.AttributeProto.TENSOR:
        tensor_proto = attr.t
        if onnx.external_data_helper.uses_external_data(tensor_proto):
            return tensor_proto
        else:
            return onnx.numpy_helper.to_array(tensor_proto)  # noqa: TID251
    # TODO:
    # - onnx.AttributeProto.GRAPH
    # - onnx.AttributeProto.SPARSE_TENSOR
    # - onnx.AttributeProto.TYPE_PROTO
    if attr.type == onnx.AttributeProto.FLOATS:
        return list(attr.floats)
    if attr.type == onnx.AttributeProto.INTS:
        return list(attr.ints)
    if attr.type == onnx.AttributeProto.STRINGS:
        return list(map(_to_str, attr.strings))
    # TODO:
    # - onnx.AttributeProto.TENSORS
    # - onnx.AttributeProto.GRAPHS
    # - onnx.AttributeProto.SPARSE_TENSORS
    # - onnx.AttributeProto.TYPE_PROTOS
    raise NotImplementedError(f"Unable to return a value for attribute {attr!r}.")


def _update_names_used_in_graph(names: set[str], graph: GraphProto) -> None:
    """Adds the names used in a graph to given set."""
    names.update(x.name for x in graph.input)
    names.update(x.name for x in graph.output)
    names.update(x.name for x in graph.initializer)
    for node in graph.node:
        _update_names_used_in_node(names, node)


def _update_names_used_in_node(names: set[str], node: onnx.NodeProto) -> None:
    names.update(node.input)
    names.update(node.output)
    for attr in node.attribute:
        if attr.HasField("g"):
            _update_names_used_in_graph(names, attr.g)
        for g in attr.graphs:
            _update_names_used_in_graph(names, g)


def _update_names_used_in_function(names: set[str], fun: FunctionProto) -> None:
    names.update(fun.input)
    names.update(fun.output)
    for node in fun.node:
        _update_names_used_in_node(names, node)


def _names_used_in_function(fun: FunctionProto) -> set[str]:
    names: set[str] = set()
    _update_names_used_in_function(names, fun)
    return names


def has_input(node: onnx.NodeProto, index: int) -> bool:
    """Returns True iff the node has an input at given index."""
    return index < len(node.input) and node.input[index] != ""


def is_onnx_op(node: onnx.NodeProto, op_type: str) -> bool:
    return node.op_type == op_type and node.domain in {"", "ai.onnx"}


def _is_used_in_graph_body(name: str, graph: GraphProto) -> bool:
    """Returns True iff the given name is used in the graph body."""
    # TODO: This is an approximation.
    names: set[str] = set()
    for node in graph.node:
        _update_names_used_in_node(names, node)
    return name in names


def _cond_is_used_in_loop_body(graph: GraphProto) -> bool:
    """Returns True iff loop requires a condition."""
    cond_in = graph.input[1].name
    cond_out = graph.output[0].name
    for node in graph.node:
        # Ignore "cond_out = Identity(cond_in)" node
        if is_onnx_op(node, "Identity") and len(node.input) == 1 and len(node.output) == 1:
            if node.input[0] == cond_in and node.output[0] == cond_out:
                continue
        names: set[str] = set()
        # TODO: The following is an approximation-based check
        _update_names_used_in_node(names, node)
        if (cond_in in names) or (cond_out in names):
            return True
    return False


class _Exporter:
    """Class used for recursive traversal of Proto structures."""

    def __init__(
        self, *, rename: bool, use_operators: bool, inline_const: bool, skip_initializers: bool
    ) -> None:
        self.use_operators = use_operators
        if rename:
            rename_function = _make_short_name_mapper()
        else:
            rename_function = _cleanup_variable_name
        self._rename_variable = self._handle_attrname_conflict(rename_function)
        self.inline_const = inline_const
        self.constants: dict[str, str] = {}
        self._attr_renaming: dict[str, str | None] = {}  # For current function.
        self._names_used: set[str] = set()  # For current function.
        # _name_remappings: used to undo the SSA-renaming in ONNX control-flow ops.
        # We map the multiple SSA-variants back to the same Python variable name.
        self._name_remappings: list[dict[str, str]] = []
        self.skip_initializers = skip_initializers
        self.skipped_initializers: dict[str, onnx.TensorProto] = {}

    def _handle_attrname_conflict(self, renamer):
        """Add ref-attr-name-conflict handling logic to renaming function."""

        def new_renamer(name):
            new_name = renamer(name)
            if new_name not in self._attr_renaming:
                return new_name
            # Name conflicts with attribute parameter name.
            alternate = self._attr_renaming[new_name]
            if alternate is not None:
                return alternate
            counter = 0
            candidate = new_name
            while candidate in self._names_used:
                candidate = f"{new_name}_{counter}"
                counter += 1
            self._attr_renaming[new_name] = candidate
            self._names_used.add(candidate)
            return candidate

        return new_renamer

    def _translate_onnx_var(self, var):
        """Converts an ONNX variable name to a python variable name."""
        if isinstance(var, ValueInfoProto):
            var = var.name
        if var == "":
            return "None"
        for scope in reversed(self._name_remappings):
            if var in scope:
                return scope[var]
        return self._rename_variable(var)

    def _translate_onnx_var_ref(self, var):
        """Translates a reference to an ONNX variable (a r-value)"""
        if var in self.constants:
            return self.constants[var]

        return self._translate_onnx_var(var)

    def _rename_domain(self, domain: str) -> str:
        if domain in {"", "ai.onnx"}:
            return "opset"  # TODO: Need checks to avoid name conflicts.
        return _cleanup_variable_name(domain)  # type: ignore[return-value]

    def _make_opset_name(self, domain, version):
        return f"{self._rename_domain(domain)}{version}"

    def _make_callee_name(self, domain, version, name, node=False):
        """Generate name to be used for called op/function in a node or for a generated script function."""
        # TODO: Avoid name-conflict between function-names and value-names
        name = _cleanup_variable_name(name)
        if node:
            if version is None:
                version = 1
            if not isinstance(version, int):
                raise TypeError(
                    f"version must be an integer not {version!r} for domain={domain!r} "
                    f"and name={name!r}."
                )
            opset = self._make_opset_name(domain, version)
            return f"{opset}.{name}"
        return name

    def _translate_graph_body(self, graph, opsets, indent=0):
        """Translates a graph body into python.
        The graph may be the main graph (of a model) or a subgraph (of a Loop or If node).
        """
        code = []
        if hasattr(graph, "initializer"):
            for init in graph.initializer:
                if self.skip_initializers:
                    size = 1
                    for d in init.dims:
                        size *= d
                    if size > _SMALL_TENSOR_SIZE:
                        init_py_name = self._translate_onnx_var(init.name)
                        if init_py_name in self.skipped_initializers:
                            raise RuntimeError(
                                f"Initializer {init.name!r} is already present in skipped_initializers."
                            )
                        self.skipped_initializers[init_py_name] = init
                        continue
                node = onnx.helper.make_node(  # noqa: TID251
                    "Constant",
                    [],
                    [self._translate_onnx_var(init.name)],  # type: ignore[list-item]
                    value=init,
                )
                pyinit = self._translate_node(node, opsets, indent=indent)
                if pyinit:
                    code.append(pyinit)
        if hasattr(graph, "sparse_initializer") and len(graph.sparse_initializer) > 0:
            raise NotImplementedError("Unable to convert sparse_initilizer into python.")
        for node in graph.node:
            pynode = self._translate_node(node, opsets, indent=indent)
            if pynode:
                if node.name:
                    pynode += f"  # {node.name}"
                code.append(pynode)

        final = "\n".join(code)
        return final

    def _translate_attributes(self, node):
        attributes = []
        for at in node.attribute:
            if _is_attribute_ref(at):
                attributes.append((at.name, at.ref_attr_name))
                continue
            value = _attribute_value(at)
            if isinstance(value, (str, bytes)):
                attributes.append((at.name, repr(value)))
                continue
            if isinstance(value, np.ndarray):
                onnx_dtype = at.t.data_type
                if len(value.shape) == 0:
                    text = (
                        f'make_tensor("value", {onnx_dtype}, dims=[], '
                        f"vals=[{repr(value.tolist()).replace('nan', 'np.nan').replace('inf', 'np.inf')}])"
                    )
                else:
                    text = (
                        f'make_tensor("value", {onnx_dtype}, dims={list(value.shape)!r}, '
                        f"vals={repr(value.ravel().tolist()).replace('nan', 'np.nan').replace('inf', 'np.inf')})"
                    )
                attributes.append((at.name, text))
                continue
            if isinstance(value, TensorProto):
                metadata = onnx.external_data_helper.ExternalDataInfo(value)
                name = value.name or "value"
                text = "external_tensor("
                text += f"{name!r}, {value.data_type}, {list(value.dims)!r}"
                text += f", {metadata.location!r}"
                if metadata.offset:
                    text += f", offset={metadata.offset!r}"
                if metadata.length:
                    text += f", length={metadata.length!r}"
                text += ")"
                attributes.append((at.name, text))
                continue
            attributes.append((at.name, repr(value)))

        return ", ".join(f"{k}={v}" for k, v in attributes)

    def _translate_if(self, node, opsets, indent=0):
        """Translates a node If into python."""
        sindent = _SINGLE_INDENT * indent
        cond = self._translate_onnx_var_ref(node.input[0])
        code = [f"{sindent}if {cond}:"]
        if len(node.attribute) != 2:
            raise RuntimeError(
                f"Node {node.op_type!r} expected two attributes not {len(node.attribute)}."
            )
        atts = node.attribute
        if atts[0].name == "else_branch":
            else_branch, then_branch = atts[0].g, atts[1].g
        else:
            else_branch, then_branch = atts[1].g, atts[0].g

        code.append(
            self._translate_graph_body(
                then_branch,
                opsets,
                indent=indent + 1,
            )
        )
        code.extend(self._emit_assign(node.output, then_branch.output, indent + 1))

        code.append(f"{sindent}else:")
        code.append(
            self._translate_graph_body(
                else_branch,
                opsets,
                indent=indent + 1,
            )
        )
        code.extend(self._emit_assign(node.output, else_branch.output, indent + 1))
        return "\n".join(code)

    def _emit_assign(self, lhs, rhs, indent):
        def to_var(x):
            if isinstance(x, ValueInfoProto):
                x = x.name
            return self._translate_onnx_var(x)

        sindent = _SINGLE_INDENT * indent

        def assign(lhs_var: str, rhs_var: str):
            return f"{sindent}{to_var(lhs_var)} = {to_var(rhs_var)}"

        if isinstance(lhs, (str, ValueInfoProto)):
            return [assign(lhs, rhs)]
        return [assign(x, y) for x, y in zip(lhs, rhs)]

    def _translate_loop(self, node, opsets, indent=0):
        """Translates a node Loop into python."""
        body = node.attribute[0].g
        sindent = _SINGLE_INDENT * indent
        rows = []

        # Node inputs: optional max-trip-count, optional condition, initial values (of dependencies)
        # Node outputs: final values (of dependencies), scan-outputs
        # Body inputs: iteration-count, condition, input values (of dependencies)
        # Body outputs: condition, output values (of dependencies), scan-outputs

        onnx_iter_var = body.input[0].name
        if has_input(node, 0):
            use_iter_var = True
            n_iter = self._translate_onnx_var(node.input[0])
        else:
            use_iter_var = _is_used_in_graph_body(onnx_iter_var, body)
            n_iter = None
        iter_var = self._translate_onnx_var(onnx_iter_var)

        cond_in = body.input[1].name
        cond_out = body.output[0].name
        py_cond = self._translate_onnx_var(cond_in)
        use_loop_cond = True  # TODO
        if has_input(node, 1):
            rows.extend(self._emit_assign(cond_in, node.input[1], indent))
        else:
            use_loop_cond = _cond_is_used_in_loop_body(body)
            # rows.append(f"{sindent}{py_cond} = True")

        num_state_vars = max(len(node.input) - 2, 0)
        actual_ins = node.input[2:]
        formal_ins = body.input[2:]
        formal_outs = body.output[1 : num_state_vars + 1]
        actual_outs = node.output[0:num_state_vars]

        rows.extend(self._emit_assign(formal_ins, actual_ins, indent))

        if node.name:
            node_name = "  # " + node.name
        else:
            node_name = ""
        if use_iter_var and not use_loop_cond:
            rows.append(f"{sindent}for {iter_var} in range({n_iter}):{node_name}")
            # The following is a hacky way to suppress the generation of
            # "cond_out = cond_in", which ONNX forces for a FOR loop.
            # TODO: a cleaner solution for this.
            self._name_remappings[-1][cond_out] = self._translate_onnx_var(cond_in)
        elif not use_iter_var and use_loop_cond:
            rows.append(f"{sindent}while {py_cond}:{node_name}")
        elif use_iter_var and use_loop_cond:
            # TODO: This needs fixing
            rows.append(f"{sindent}for {iter_var} in range({n_iter}):{node_name}")
            rows.append(f"{sindent}{_SINGLE_INDENT}if not {py_cond}:")
            rows.append(f"{sindent}{_SINGLE_INDENT * 2}break")
        else:
            raise RuntimeError(
                f"Unable to export loop type {node.op_type!r} into python because "
                "there is no stop condition."
            )

        rows.append(
            self._translate_graph_body(
                body,
                opsets,
                indent=indent + 1,
            )
        )
        if use_loop_cond:
            rows.extend(self._emit_assign(cond_in, cond_out, indent + 1))
        rows.extend(self._emit_assign(formal_ins, formal_outs, indent + 1))
        rows.extend(self._emit_assign(actual_outs, formal_ins, indent))

        # TODO: This doesn't handle scan-outputs yet.

        return "\n".join(rows)

    def _translate_scan(self, node, opsets, indent=0):
        """Translates a node Scan into python."""
        raise NotImplementedError()

    def _translate_node(self, onnx_node, opsets, indent=0):
        if isinstance(onnx_node, dict):
            node = onnx_node["onnx_node"]
        else:
            node = onnx_node
        if self.inline_const and node.op_type == "Constant":
            val = _get_const_repr(node)
            if val is not None:
                self.constants[node.output[0]] = str(val)
                return ""
        if node.op_type in {"If", "Loop", "Scan"}:
            # If, Loop, Scan
            if node.op_type == "If":
                return self._translate_if(node, opsets, indent=indent)
            if node.op_type == "Loop":
                return self._translate_loop(node, opsets, indent=indent)
            if node.op_type == "Scan":
                return self._translate_scan(node, opsets, indent=indent)
            raise RuntimeError(f"Unable to export node type {node.op_type!r} into python.")
        if any(hasattr(att, "g") and att.g and att.g.ByteSize() > 0 for att in node.attribute):
            raise RuntimeError(f"Unable to export node type {node.op_type!r} into python.")
        ops = {
            "Add": "+",
            "Sub": "-",
            "Mul": "*",
            "MatMul": "@",
            "Div": "/",
            "Pow": "**",
            "And": "&",
            "Or": "|",
            "Greater": ">",
            "Equal": "==",
            "Lesser": "<",
            "GreaterOrEqual": ">=",
            "LessOrEqual": "<=",
        }
        sindent = _SINGLE_INDENT * indent
        if self.use_operators and node.op_type in ops:
            return (
                f"{sindent}{self._translate_onnx_var(node.output[0])} = "
                f"{(f' {ops[node.op_type]} ').join(map(self._translate_onnx_var_ref, node.input))}"
            )
        callee_name = self._make_callee_name(
            node.domain, opsets[node.domain], node.op_type, node=True
        )
        attributes_str = self._translate_attributes(node)
        if len(node.input) > 0 and len(attributes_str) > 0:
            attributes_str = f", {attributes_str}"
        output_names: list[Any] = []
        for i, o in enumerate(node.output):
            if o in ("", None):
                output_names.append(f"_{i}")
            else:
                output_names.append(self._translate_onnx_var(o))

        input_names = [self._translate_onnx_var_ref(x) for x in node.input]

        # Suppress generation of redundant copy: used to suppress "cond_out = cond_in"
        # from an ONNX FOR loop, which can cause problems in python.
        if node.op_type == "Identity" and len(node.input) == 1 and len(node.output) == 1:
            if output_names[0] == input_names[0]:
                return ""
        text = [
            sindent,
            ", ".join(output_names),
            " = ",
            callee_name,
            "(",
            ", ".join(input_names),
            attributes_str,
            ")",
        ]
        return "".join(text)

    def _translate_opset_import(self, domain: str, version: int) -> str:
        if domain in {"", "ai.onnx"}:
            return f"from onnxscript.onnx_opset import opset{version}\n"
        else:
            varname = self._make_opset_name(domain, version)
            return f"{varname} = Opset('{domain}', {version})\n"

    def _translate_opset_imports(
        self, opset_imports: Sequence[onnx.OperatorSetIdProto]
    ) -> str:
        return "".join(
            [self._translate_opset_import(x.domain, x.version) for x in opset_imports]
        )

    def _translate_opset_imports_of(
        self, proto: ModelProto | FunctionProto | GraphProto
    ) -> str:
        if hasattr(proto, "opset_import"):
            text = self._translate_opset_imports(proto.opset_import)
            if isinstance(proto, FunctionProto):
                if not any(x.domain == proto.domain for x in proto.opset_import):
                    text += self._translate_opset_import(proto.domain, 1)
            return text
        return ""

    def _translate_function_signature(self, funproto: onnx.FunctionProto) -> str:
        """Generate signature for FunctionProto."""
        type_map = _attribute_param_types(funproto)

        def attr_sig(attr_name: str) -> str:
            self._attr_renaming[attr_name] = None
            self._names_used.add(attr_name)
            # A default type of INT is used for attribute parameters that are never used.
            type = type_map.get(attr_name, onnx.AttributeProto.INT)
            typerep = type_annotation.onnx_attr_type_to_onnxscript_repr(type)
            return f"{attr_name}: {typerep}"

        inputs = [self._translate_onnx_var(x) for x in funproto.input]
        attrs = [attr_sig(x) for x in funproto.attribute]
        input_and_attrs = ", ".join(inputs + attrs)  # type: ignore[arg-type]
        if len(funproto.attribute_proto) > 0:
            message = "\n   # Attribute parameters default-values not handled yet."
        else:
            message = ""
        return f"({input_and_attrs}):{message}"

    def _translate_function(self, funproto: onnx.FunctionProto) -> str:
        """Generate python code for FunctionProto."""
        opsets = {}
        for imported in funproto.opset_import:
            opsets[imported.domain] = imported.version
        self._attr_renaming = {}
        used_proto_names = _names_used_in_function(funproto)
        renamed_names_used = [self._translate_onnx_var(x) for x in used_proto_names]
        self._names_used = set(renamed_names_used)
        result = []

        def add_line(line: str) -> None:
            result.append(line)

        opset_name = self._make_opset_name(funproto.domain, 1)
        add_line(f"@script({opset_name})")
        fun_name = self._make_callee_name(funproto.domain, 1, funproto.name)
        fun_sig = self._translate_function_signature(funproto)
        add_line(f"def {fun_name}{fun_sig}")
        if funproto.doc_string:
            add_line(f'    """{funproto.doc_string}"""')
        self._name_remappings.append({})
        for node in funproto.node:
            add_line(self._translate_node(node, opsets, indent=1))
        return_values = ", ".join(self._translate_onnx_var(x) for x in funproto.output)
        add_line(f"    return {return_values}")
        self._name_remappings.pop()
        return "\n".join(result)

    def _translate_graph(self, model: onnx.ModelProto, function_name: Optional[str]) -> str:
        graph = model.graph
        opsets = {}
        for imported in model.opset_import:
            opsets[imported.domain] = imported.version
        if function_name is None:
            function_name = _cleanup_variable_name(graph.name)

        result: list[str] = []

        def add(line: str) -> None:
            result.append(line)

        if self.skip_initializers:
            indent_level = 2
            indent = _SINGLE_INDENT
        else:
            indent_level = 1
            indent = ""
        add(f"{indent}@script()")
        add(f"{indent}def {function_name}{_translate_signature(graph.input, graph.output)}")
        indent = indent + _SINGLE_INDENT
        doc = graph.doc_string
        if doc:
            add(f'{indent}"""{doc}"""')
        add(self._translate_graph_body(graph, opsets, indent=indent_level))
        return_values = ", ".join(self._translate_onnx_var(x) for x in graph.output)
        add(f"{indent}return {return_values}")
        script = "\n".join(result)
        if self.skipped_initializers:
            value_infos = _translate_value_infos(graph.value_info)
            return self._substitute_initializers(script, function_name, value_infos)
        return script

    def _substitute_initializers(
        self, script: str, script_function_name: str, value_infos: str
    ) -> str:
        init_names = self.skipped_initializers.keys()
        # Formal parameters representing initializers (single level indentation)
        __ = _SINGLE_INDENT
        initializers_as_params = "\n".join(f"{__}{x}," for x in init_names)

        def generate_rand(name: str, value: TensorProto) -> str:
            shape = ",".join(str(d) for d in value.dims)
            if value.data_type == TensorProto.FLOAT:
                return f"{__}{name} = np.random.rand({shape}).astype(np.float32)"
            if value.data_type == TensorProto.INT8:
                return f"{__}{name} = np.random.randint(-128, 127, size=({shape},), dtype=np.int8)"
            raise NotImplementedError(
                f"Unable to generate random initializer for data type {value.data_type}."
            )

        random_initializer_values = "\n".join(
            generate_rand(key, value) for key, value in self.skipped_initializers.items()
        )
        # Actual parameter values for initializers (double level indentation)
        indented_initializers_as_params = "\n".join(f"{__}{__}{x}," for x in init_names)
        return f"""
value_infos = {value_infos}

def make_model(
{initializers_as_params}
):
{script}

{__}model = {script_function_name}.to_model_proto(value_infos=value_infos)
{__}return model

def make_model_with_random_weights():
{random_initializer_values}
{__}model = make_model(
{indented_initializers_as_params}
{__})
{__}return model
"""

    def _import_onnx_types(
        self, proto: onnx.ModelProto | onnx.GraphProto | onnx.FunctionProto
    ) -> str:
        """Generate import statements for types used in the graph."""
        if isinstance(proto, ModelProto):
            graph_or_function = proto.graph
        else:
            graph_or_function = proto
        used_types: set[str] = set()
        for t in list(graph_or_function.input) + list(graph_or_function.output):
            if hasattr(t, "type"):
                ts = _translate_type(t.type)
                its = ts.split("[", maxsplit=1)[0]
                used_types.add(its)
        # TODO: handle types in nested graphs.
        sorted_types = sorted(used_types)
        if sorted_types:
            return "from onnxscript.onnx_types import " + ", ".join(sorted_types)
        return ""

    def export(
        self, proto: onnx.ModelProto | onnx.FunctionProto, function_name: Optional[str]
    ) -> str:
        result: list[str] = []

        def add(line: str) -> None:
            result.append(line)

        # Generic imports.
        add("import numpy as np")
        add("from onnx import TensorProto")
        add("from onnx.helper import make_tensor")
        add("from onnxscript import script, external_tensor")
        add("from onnxscript.values import Opset")
        add(self._import_onnx_types(proto))

        if isinstance(proto, ModelProto):
            translated_functions = [self._translate_function(f) for f in proto.functions]
            translated_functions.append(self._translate_graph(proto, function_name))
        else:
            assert isinstance(proto, FunctionProto)
            translated_functions = [self._translate_function(proto)]

        # TODO: unique_function_domain_version.add((f.domain, 1))
        add(self._translate_opset_imports_of(proto))
        result.extend(translated_functions)

        add("")
        final = "\n".join(result)

        if "\nreturn" in final:
            raise SyntaxError(f"The produced code is wrong.\n{final}")

        return final


def _attribute_param_types(
    funproto: onnx.FunctionProto,
) -> dict[str, onnx.AttributeProto.AttributeType]:
    """Compute mapping from (names of) attribute parameters of function to their types."""
    type_map = {}

    def visit_node(node: onnx.NodeProto) -> None:
        for attr in node.attribute:
            if _is_attribute_ref(attr):
                type_map[attr.ref_attr_name] = attr.type
            elif attr.type == onnx.AttributeProto.GRAPH:
                visit_graph(attr.g)
            elif attr.type == onnx.AttributeProto.GRAPHS:
                for graph in attr.graphs:
                    visit_graph(graph)

    def visit_graph(graph: onnx.GraphProto) -> None:
        for node in graph.node:
            visit_node(node)

    for node in funproto.node:
        visit_node(node)
    return type_map


def export2python(
    model_onnx,
    function_name: Optional[str] = None,
    *,
    rename: bool = False,
    use_operators: bool = False,
    inline_const: bool = False,
    skip_initializers: bool = False,
):
    """Exports an ONNX model to the *python* syntax.

    Args:
        model_onnx: string or ONNX graph
        rename: rename the names to get shorter names
        function_name: main function name
        use_operators: use Python operators.
        inline_const: replace ONNX constants inline if compact
        skip_initializers: generated script will not include initializers.
          Instead, a function that generates the model, given initializer values, is generated,
          along with one that generates random values for the initializers.

    Returns:
        python code
    The following example shows what a python code creating a graph
    implementing the KMeans would look like.
    .. runpython::
        :showcode:
        :process:
        import numpy as np
        from sklearn.cluster import KMeans
        from mlprodict.onnx_conv import to_onnx
        from mlprodict.onnx_tools.onnx_export import export2python
        X = np.arange(20).reshape(10, 2).astype(np.float32)
        tr = KMeans(n_clusters=2)
        tr.fit(X)
        onx = to_onnx(tr, X, target_opset=14)
        code = export2python(onx)
        print(code)
    """
    if isinstance(model_onnx, str):
        model_onnx = onnx.load(model_onnx)

    if not isinstance(model_onnx, (ModelProto, FunctionProto)):
        raise TypeError(f"The function expects a ModelProto not {type(model_onnx)!r}.")

    exporter = _Exporter(
        rename=rename,
        use_operators=use_operators,
        inline_const=inline_const,
        skip_initializers=skip_initializers,
    )
    return exporter.export(model_onnx, function_name)