diff --git a/docs_nnx/guides/flax_gspmd.ipynb b/docs_nnx/guides/flax_gspmd.ipynb
index b1e4c1404..bd98c3603 100644
--- a/docs_nnx/guides/flax_gspmd.ipynb
+++ b/docs_nnx/guides/flax_gspmd.ipynb
@@ -47,6 +47,8 @@
     "from flax import nnx\n",
     "\n",
     "# Ignore this if you are already running on a TPU or GPU\n",
+    "nnx.set_graph_mode(False)\n",
+    "nnx.set_graph_updates(False)\n",
     "if not jax._src.xla_bridge.backends_are_initialized():\n",
     "  jax.config.update('jax_num_cpu_devices', 8)\n",
     "print(f'You have 8 “fake” JAX devices now: {jax.devices()}')"
@@ -85,7 +87,6 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "nnx.use_eager_sharding(True)\n",
     "assert nnx.using_eager_sharding()"
    ]
   },
@@ -99,7 +100,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 4,
    "id": "2d849e2e",
    "metadata": {},
    "outputs": [],
@@ -118,12 +119,30 @@
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 5,
    "id": "67bbd440",
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "Param( # 16 (64 B)\n",
+       "  value=Array([[1., 1., 1., 1.],\n",
+       "         [1., 1., 1., 1.],\n",
+       "         [1., 1., 1., 1.],\n",
+       "         [1., 1., 1., 1.]], dtype=float32),\n",
+       "  out_sharding=(None, 'model'),\n",
+       "  mesh=Mesh(axis_sizes=(2, 4), axis_names=('data', 'model'), axis_types=(Explicit, Explicit))\n",
+       ")"
+      ]
+     },
+     "execution_count": 5,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
    "source": [
-    "nnx.Param(jnp.ones(4,4), out_sharding=(None, 'model'), eager_sharding=True, mesh=auto_mesh)"
+    "nnx.Param(jnp.ones((4, 4)), out_sharding=(None, 'model'), eager_sharding=True, mesh=auto_mesh)"
    ]
   },
   {
@@ -141,7 +160,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 4,
+   "execution_count": 6,
    "metadata": {},
    "outputs": [
     {
@@ -210,7 +229,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 7,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -242,7 +261,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 6,
+   "execution_count": 8,
    "metadata": {},
    "outputs": [
     {
@@ -319,21 +338,20 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 7,
+   "execution_count": 16,
    "metadata": {},
    "outputs": [],
    "source": [
     "class DotReluDot(nnx.Module):\n",
     "  def __init__(self, depth: int, rngs: nnx.Rngs):\n",
-    "    init_fn = nnx.initializers.lecun_normal()\n",
     "    self.dot1 = nnx.Linear(\n",
     "      depth, depth,\n",
-    "      kernel_init=nnx.with_partitioning(init_fn, (None, 'model')),\n",
+    "      kernel_metadata={'out_sharding': (None, 'model')},\n",
     "      use_bias=False,  # or use `bias_init` to give it annotation too\n",
     "      rngs=rngs)\n",
     "    self.w2 = nnx.Param(\n",
-    "      init_fn(rngs.params(), (depth, depth)),  # RNG key and shape for W2 creation\n",
-    "      sharding=('model', None),\n",
+    "      rngs.params.lecun_normal()((depth, depth)),  # RNG key and shape for W2 creation\n",
+    "      out_sharding=('model', None),\n",
     "    )\n",
     "\n",
     "  def __call__(self, x: jax.Array):\n",
@@ -347,7 +365,8 @@
     "  def __init__(self, depth: int, num_layers: int, rngs: nnx.Rngs):\n",
     "    # Annotate the additional axis with sharding=None, meaning it will be\n",
     "    # replicated across all devices.\n",
-    "    @nnx.vmap(transform_metadata={nnx.PARTITION_NAME: None})\n",
+    "    @nnx.vmap\n",
+    "    @nnx.transform_metadata(partition=None)\n",
     "    def create_sublayers(r):\n",
     "      return DotReluDot(depth, r)\n",
     "    self.layers = create_sublayers(rngs.fork(split=num_layers))\n",
@@ -368,18 +387,100 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 8,
+   "execution_count": 19,
    "metadata": {},
    "outputs": [
+    {
+     "name": "stderr",
+     "output_type": "stream",
+     "text": [
+      "/var/folders/qj/tkq3kvtd66z1t36rfyj9vg0w016bdd/T/ipykernel_21221/1601373863.py:28: DeprecationWarning: The 'split' argument of 'fork' is deprecated; use the 'split' method instead.\n",
+      "  self.layers = create_sublayers(rngs.fork(split=num_layers))\n"
+     ]
+    },
     {
      "name": "stdout",
      "output_type": "stream",
      "text": [
-      "1.251457\n",
-      "0.8495563\n",
-      "0.6590716\n",
-      "0.5399748\n",
-      "0.39150265\n"
+      "\u001b[38;2;79;201;177mMultiDotReluDot\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # Param: 4,194,304 (16.8 MB)\u001b[0m\n",
+      "  \u001b[38;2;156;220;254mlayers\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mDotReluDot\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # Param: 4,194,304 (16.8 MB)\u001b[0m\n",
+      "    \u001b[38;2;156;220;254mdot1\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mLinear\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # Param: 2,097,152 (8.4 MB)\u001b[0m\n",
+      "      \u001b[38;2;156;220;254mbias\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;86;156;214mNone\u001b[0m,\n",
+      "      \u001b[38;2;156;220;254mkernel\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mParam\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # 2,097,152 (8.4 MB)\u001b[0m\n",
+      "        \u001b[38;2;156;220;254mvalue\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mArray\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;156;220;254mshape\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;182;207;169m2\u001b[0m, \u001b[38;2;182;207;169m1024\u001b[0m, \u001b[38;2;182;207;169m1024\u001b[0m\u001b[38;2;255;213;3m)\u001b[0m, \u001b[38;2;156;220;254mdtype\u001b[0m\u001b[38;2;212;212;212m=\u001b[0mdtype('float32')\u001b[38;2;255;213;3m)\u001b[0m,\n",
+      "        \u001b[38;2;156;220;254mout_sharding\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;86;156;214mNone\u001b[0m, \u001b[38;2;86;156;214mNone\u001b[0m, \u001b[38;2;207;144;120m'model'\u001b[0m\u001b[38;2;255;213;3m)\u001b[0m\n",
+      "      \u001b[38;2;255;213;3m)\u001b[0m,\n",
+      "      \u001b[38;2;156;220;254mdot_general\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m<function dot_general at 0x1174d3420>,\n",
+      "      \u001b[38;2;156;220;254mdtype\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;86;156;214mNone\u001b[0m,\n",
+      "      \u001b[38;2;156;220;254min_features\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;182;207;169m1024\u001b[0m,\n",
+      "      \u001b[38;2;156;220;254mout_features\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;182;207;169m1024\u001b[0m,\n",
+      "      \u001b[38;2;156;220;254mparam_dtype\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mfloat32\u001b[0m,\n",
+      "      \u001b[38;2;156;220;254mprecision\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;86;156;214mNone\u001b[0m,\n",
+      "      \u001b[38;2;156;220;254mpreferred_element_type\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;86;156;214mNone\u001b[0m,\n",
+      "      \u001b[38;2;156;220;254mpromote_dtype\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m<function promote_dtype at 0x1312076a0>,\n",
+      "      \u001b[38;2;156;220;254muse_bias\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;86;156;214mFalse\u001b[0m\n",
+      "    \u001b[38;2;255;213;3m)\u001b[0m,\n",
+      "    \u001b[38;2;156;220;254mw2\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mParam\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # 2,097,152 (8.4 MB)\u001b[0m\n",
+      "      \u001b[38;2;156;220;254mvalue\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mArray\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;156;220;254mshape\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;182;207;169m2\u001b[0m, \u001b[38;2;182;207;169m1024\u001b[0m, \u001b[38;2;182;207;169m1024\u001b[0m\u001b[38;2;255;213;3m)\u001b[0m, \u001b[38;2;156;220;254mdtype\u001b[0m\u001b[38;2;212;212;212m=\u001b[0mdtype('float32')\u001b[38;2;255;213;3m)\u001b[0m,\n",
+      "      \u001b[38;2;156;220;254mout_sharding\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;207;144;120m'model'\u001b[0m, \u001b[38;2;86;156;214mNone\u001b[0m\u001b[38;2;255;213;3m)\u001b[0m\n",
+      "    \u001b[38;2;255;213;3m)\u001b[0m\n",
+      "  \u001b[38;2;255;213;3m)\u001b[0m\n",
+      "\u001b[38;2;255;213;3m)\u001b[0m\n"
+     ]
+    },
+    {
+     "ename": "ValueError",
+     "evalue": "Sharding spec ('model',) implies that array axis 0 is partitioned 4 times, but does not evenly divide the dimension size 2. Got shape: (2, 1024, 1024) and sharding NamedSharding(mesh=AbstractMesh('data': 2, 'model': 4, axis_types=(Explicit, Explicit), device_kind=cpu, num_cores=None), spec=PartitionSpec('model', None, None))",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[31m---------------------------------------------------------------------------\u001b[39m",
+      "\u001b[31mValueError\u001b[39m                                Traceback (most recent call last)",
+      "\u001b[36mCell\u001b[39m\u001b[36m \u001b[39m\u001b[32mIn[19]\u001b[39m\u001b[32m, line 19\u001b[39m\n\u001b[32m     17\u001b[39m model = MultiDotReluDot(\u001b[32m1024\u001b[39m, \u001b[32m2\u001b[39m, rngs=nnx.Rngs(\u001b[32m0\u001b[39m))\n\u001b[32m     18\u001b[39m \u001b[38;5;28mprint\u001b[39m(model)\n\u001b[32m---> \u001b[39m\u001b[32m19\u001b[39m optimizer = \u001b[43mnnx\u001b[49m\u001b[43m.\u001b[49m\u001b[43mOptimizer\u001b[49m\u001b[43m(\u001b[49m\u001b[43mmodel\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43moptax\u001b[49m\u001b[43m.\u001b[49m\u001b[43madam\u001b[49m\u001b[43m(\u001b[49m\u001b[32;43m1e-3\u001b[39;49m\u001b[43m)\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mwrt\u001b[49m\u001b[43m=\u001b[49m\u001b[43mnnx\u001b[49m\u001b[43m.\u001b[49m\u001b[43mParam\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m     21\u001b[39m \u001b[38;5;66;03m# The loop\u001b[39;00m\n\u001b[32m     22\u001b[39m \u001b[38;5;28;01mfor\u001b[39;00m i \u001b[38;5;129;01min\u001b[39;00m \u001b[38;5;28mrange\u001b[39m(\u001b[32m5\u001b[39m):\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/nnx/pytreelib.py:420\u001b[39m, in \u001b[36mPytreeMeta.__call__\u001b[39m\u001b[34m(cls, *args, **kwargs)\u001b[39m\n\u001b[32m    419\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34m__call__\u001b[39m(\u001b[38;5;28mcls\u001b[39m, *args: Any, **kwargs: Any) -> Any:\n\u001b[32m--> \u001b[39m\u001b[32m420\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43m_graph_node_meta_call\u001b[49m\u001b[43m(\u001b[49m\u001b[38;5;28;43mcls\u001b[39;49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/nnx/pytreelib.py:431\u001b[39m, in \u001b[36m_graph_node_meta_call\u001b[39m\u001b[34m(cls, *args, **kwargs)\u001b[39m\n\u001b[32m    429\u001b[39m \u001b[38;5;28mobject\u001b[39m.\u001b[34m__setattr__\u001b[39m(node, \u001b[33m'\u001b[39m\u001b[33m_pytree__state\u001b[39m\u001b[33m'\u001b[39m, PytreeState())\n\u001b[32m    430\u001b[39m \u001b[38;5;28mobject\u001b[39m.\u001b[34m__setattr__\u001b[39m(node, \u001b[33m'\u001b[39m\u001b[33m_pytree__nodes\u001b[39m\u001b[33m'\u001b[39m, \u001b[38;5;28mcls\u001b[39m._pytree__nodes)\n\u001b[32m--> \u001b[39m\u001b[32m431\u001b[39m \u001b[38;5;28;43mcls\u001b[39;49m\u001b[43m.\u001b[49m\u001b[43m_pytree_meta_construct\u001b[49m\u001b[43m(\u001b[49m\u001b[43mnode\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m    432\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m \u001b[38;5;28mcls\u001b[39m._pytree__is_pytree:\n\u001b[32m    433\u001b[39m   missing: \u001b[38;5;28mdict\u001b[39m[\u001b[38;5;28mstr\u001b[39m, \u001b[38;5;28mbool\u001b[39m] = {}\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/nnx/pytreelib.py:423\u001b[39m, in \u001b[36mPytreeMeta._pytree_meta_construct\u001b[39m\u001b[34m(cls, self, *args, **kwargs)\u001b[39m\n\u001b[32m    422\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34m_pytree_meta_construct\u001b[39m(\u001b[38;5;28mcls\u001b[39m, \u001b[38;5;28mself\u001b[39m, *args, **kwargs):\n\u001b[32m--> \u001b[39m\u001b[32m423\u001b[39m   \u001b[38;5;28;43mself\u001b[39;49m\u001b[43m.\u001b[49m\u001b[34;43m__init__\u001b[39;49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/nnx/training/optimizer.py:88\u001b[39m, in \u001b[36m_check_wrt_arg_passed.<locals>._check_wrt_wrapper\u001b[39m\u001b[34m(wrt, *args, **kwargs)\u001b[39m\n\u001b[32m     83\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m \u001b[38;5;28misinstance\u001b[39m(wrt, _Missing):\n\u001b[32m     84\u001b[39m   \u001b[38;5;28;01mraise\u001b[39;00m \u001b[38;5;167;01mTypeError\u001b[39;00m(\n\u001b[32m     85\u001b[39m     \u001b[33m'\u001b[39m\u001b[33mMissing required argument `wrt`. As of Flax 0.11.0 the `wrt` argument is required, \u001b[39m\u001b[33m'\u001b[39m\n\u001b[32m     86\u001b[39m     \u001b[33m'\u001b[39m\u001b[33mif you want to keep the previous use nnx.ModelAndOptimizer instead of nnx.Optimizer.\u001b[39m\u001b[33m'\u001b[39m\n\u001b[32m     87\u001b[39m   )\n\u001b[32m---> \u001b[39m\u001b[32m88\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mf\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mwrt\u001b[49m\u001b[43m=\u001b[49m\u001b[43mwrt\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/nnx/training/optimizer.py:154\u001b[39m, in \u001b[36mOptimizer.__init__\u001b[39m\u001b[34m(self, model, tx, wrt)\u001b[39m\n\u001b[32m    151\u001b[39m \u001b[38;5;28mself\u001b[39m.step = OptState(jnp.array(\u001b[32m0\u001b[39m, dtype=jnp.uint32))\n\u001b[32m    152\u001b[39m \u001b[38;5;28mself\u001b[39m.tx = tx\n\u001b[32m    153\u001b[39m \u001b[38;5;28mself\u001b[39m.opt_state = nnx.data(\n\u001b[32m--> \u001b[39m\u001b[32m154\u001b[39m   \u001b[43mto_opt_state\u001b[49m\u001b[43m(\u001b[49m\u001b[43mtx\u001b[49m\u001b[43m.\u001b[49m\u001b[43minit\u001b[49m\u001b[43m(\u001b[49m\u001b[43mnnx\u001b[49m\u001b[43m.\u001b[49m\u001b[43mstate\u001b[49m\u001b[43m(\u001b[49m\u001b[43mmodel\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mwrt\u001b[49m\u001b[43m)\u001b[49m\u001b[43m)\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m    155\u001b[39m )\n\u001b[32m    156\u001b[39m \u001b[38;5;28mself\u001b[39m.wrt = wrt\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/nnx/training/optimizer.py:57\u001b[39m, in \u001b[36mto_opt_state\u001b[39m\u001b[34m(tree)\u001b[39m\n\u001b[32m     54\u001b[39m     opt_state = OptArray(x)\n\u001b[32m     55\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m opt_state\n\u001b[32m---> \u001b[39m\u001b[32m57\u001b[39m tree = \u001b[43mjax\u001b[49m\u001b[43m.\u001b[49m\u001b[43mtree\u001b[49m\u001b[43m.\u001b[49m\u001b[43mmap\u001b[49m\u001b[43m(\u001b[49m\n\u001b[32m     58\u001b[39m \u001b[43m  \u001b[49m\u001b[43m_to_opt_state\u001b[49m\u001b[43m,\u001b[49m\n\u001b[32m     59\u001b[39m \u001b[43m  \u001b[49m\u001b[43mtree\u001b[49m\u001b[43m,\u001b[49m\n\u001b[32m     60\u001b[39m \u001b[43m  \u001b[49m\u001b[43mis_leaf\u001b[49m\u001b[43m=\u001b[49m\u001b[38;5;28;43;01mlambda\u001b[39;49;00m\u001b[43m \u001b[49m\u001b[43mx\u001b[49m\u001b[43m:\u001b[49m\u001b[43m \u001b[49m\u001b[38;5;28;43misinstance\u001b[39;49m\u001b[43m(\u001b[49m\u001b[43mx\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mVariable\u001b[49m\u001b[43m)\u001b[49m\u001b[43m,\u001b[49m\n\u001b[32m     61\u001b[39m \u001b[43m\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m     62\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m tree\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/tree.py:155\u001b[39m, in \u001b[36mmap\u001b[39m\u001b[34m(f, tree, is_leaf, *rest)\u001b[39m\n\u001b[32m    115\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34mmap\u001b[39m(f: Callable[..., Any],\n\u001b[32m    116\u001b[39m         tree: Any,\n\u001b[32m    117\u001b[39m         *rest: Any,\n\u001b[32m    118\u001b[39m         is_leaf: Callable[[Any], \u001b[38;5;28mbool\u001b[39m] | \u001b[38;5;28;01mNone\u001b[39;00m = \u001b[38;5;28;01mNone\u001b[39;00m) -> Any:\n\u001b[32m    119\u001b[39m \u001b[38;5;250m  \u001b[39m\u001b[33;03m\"\"\"Maps a multi-input function over pytree args to produce a new pytree.\u001b[39;00m\n\u001b[32m    120\u001b[39m \n\u001b[32m    121\u001b[39m \u001b[33;03m  Args:\u001b[39;00m\n\u001b[32m   (...)\u001b[39m\u001b[32m    153\u001b[39m \u001b[33;03m    - :func:`jax.tree.reduce`\u001b[39;00m\n\u001b[32m    154\u001b[39m \u001b[33;03m  \"\"\"\u001b[39;00m\n\u001b[32m--> \u001b[39m\u001b[32m155\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mtree_util\u001b[49m\u001b[43m.\u001b[49m\u001b[43mtree_map\u001b[49m\u001b[43m(\u001b[49m\u001b[43mf\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mtree\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43mrest\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mis_leaf\u001b[49m\u001b[43m=\u001b[49m\u001b[43mis_leaf\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/tree_util.py:369\u001b[39m, in \u001b[36mtree_map\u001b[39m\u001b[34m(f, tree, is_leaf, *rest)\u001b[39m\n\u001b[32m    367\u001b[39m leaves, treedef = tree_flatten(tree, is_leaf)\n\u001b[32m    368\u001b[39m all_leaves = [leaves] + [treedef.flatten_up_to(r) \u001b[38;5;28;01mfor\u001b[39;00m r \u001b[38;5;129;01min\u001b[39;00m rest]\n\u001b[32m--> \u001b[39m\u001b[32m369\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mtreedef\u001b[49m\u001b[43m.\u001b[49m\u001b[43munflatten\u001b[49m\u001b[43m(\u001b[49m\u001b[43mf\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43mxs\u001b[49m\u001b[43m)\u001b[49m\u001b[43m \u001b[49m\u001b[38;5;28;43;01mfor\u001b[39;49;00m\u001b[43m \u001b[49m\u001b[43mxs\u001b[49m\u001b[43m \u001b[49m\u001b[38;5;129;43;01min\u001b[39;49;00m\u001b[43m \u001b[49m\u001b[38;5;28;43mzip\u001b[39;49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43mall_leaves\u001b[49m\u001b[43m)\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/tree_util.py:369\u001b[39m, in \u001b[36m<genexpr>\u001b[39m\u001b[34m(.0)\u001b[39m\n\u001b[32m    367\u001b[39m leaves, treedef = tree_flatten(tree, is_leaf)\n\u001b[32m    368\u001b[39m all_leaves = [leaves] + [treedef.flatten_up_to(r) \u001b[38;5;28;01mfor\u001b[39;00m r \u001b[38;5;129;01min\u001b[39;00m rest]\n\u001b[32m--> \u001b[39m\u001b[32m369\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m treedef.unflatten(\u001b[43mf\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43mxs\u001b[49m\u001b[43m)\u001b[49m \u001b[38;5;28;01mfor\u001b[39;00m xs \u001b[38;5;129;01min\u001b[39;00m \u001b[38;5;28mzip\u001b[39m(*all_leaves))\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/nnx/training/optimizer.py:52\u001b[39m, in \u001b[36mto_opt_state.<locals>._to_opt_state\u001b[39m\u001b[34m(x)\u001b[39m\n\u001b[32m     50\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34m_to_opt_state\u001b[39m(x):\n\u001b[32m     51\u001b[39m   \u001b[38;5;28;01mif\u001b[39;00m \u001b[38;5;28misinstance\u001b[39m(x, Variable):\n\u001b[32m---> \u001b[39m\u001b[32m52\u001b[39m     opt_state = \u001b[43mOptVariable\u001b[49m\u001b[43m(\u001b[49m\u001b[43mx\u001b[49m\u001b[43m.\u001b[49m\u001b[43mget_value\u001b[49m\u001b[43m(\u001b[49m\u001b[43m)\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mx\u001b[49m\u001b[43m.\u001b[49m\u001b[43mget_metadata\u001b[49m\u001b[43m(\u001b[49m\u001b[43m)\u001b[49m\u001b[43m)\u001b[49m  \u001b[38;5;66;03m# type: ignore\u001b[39;00m\n\u001b[32m     53\u001b[39m   \u001b[38;5;28;01melse\u001b[39;00m:\n\u001b[32m     54\u001b[39m     opt_state = OptArray(x)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/nnx/variablelib.py:1165\u001b[39m, in \u001b[36mVariableMeta.__call__\u001b[39m\u001b[34m(cls, *args, **kwargs)\u001b[39m\n\u001b[32m   1164\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34m__call__\u001b[39m(\u001b[38;5;28mcls\u001b[39m, *args, **kwargs):\n\u001b[32m-> \u001b[39m\u001b[32m1165\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[38;5;28;43mcls\u001b[39;49m\u001b[43m.\u001b[49m\u001b[43m_variable_meta_call\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/nnx/variablelib.py:1168\u001b[39m, in \u001b[36mVariableMeta._variable_meta_call\u001b[39m\u001b[34m(cls, *args, **kwargs)\u001b[39m\n\u001b[32m   1167\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34m_variable_meta_call\u001b[39m(\u001b[38;5;28mcls\u001b[39m, *args, **kwargs):\n\u001b[32m-> \u001b[39m\u001b[32m1168\u001b[39m   variable = \u001b[38;5;28;43msuper\u001b[39;49m\u001b[43m(\u001b[49m\u001b[43m)\u001b[49m\u001b[43m.\u001b[49m\u001b[34;43m__call__\u001b[39;49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m   1169\u001b[39m   \u001b[38;5;28;01mif\u001b[39;00m variable.hijax:\n\u001b[32m   1170\u001b[39m     \u001b[38;5;28;01mreturn\u001b[39;00m _new_hijax_from_variable(variable)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/nnx/variablelib.py:1352\u001b[39m, in \u001b[36mVariable.__init__\u001b[39m\u001b[34m(self, value, hijax, ref, eager_sharding, **metadata)\u001b[39m\n\u001b[32m   1350\u001b[39m \u001b[38;5;66;03m# shard the _value if applicable\u001b[39;00m\n\u001b[32m   1351\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m eager_sharding \u001b[38;5;129;01mand\u001b[39;00m \u001b[33m'\u001b[39m\u001b[33mout_sharding\u001b[39m\u001b[33m'\u001b[39m \u001b[38;5;129;01min\u001b[39;00m metadata:\n\u001b[32m-> \u001b[39m\u001b[32m1352\u001b[39m   value = \u001b[43mcore_spmd\u001b[49m\u001b[43m.\u001b[49m\u001b[43mshard_value\u001b[49m\u001b[43m(\u001b[49m\n\u001b[32m   1353\u001b[39m \u001b[43m    \u001b[49m\u001b[43mvalue\u001b[49m\u001b[43m,\u001b[49m\n\u001b[32m   1354\u001b[39m \u001b[43m    \u001b[49m\u001b[43mmetadata\u001b[49m\u001b[43m[\u001b[49m\u001b[33;43m'\u001b[39;49m\u001b[33;43mout_sharding\u001b[39;49m\u001b[33;43m'\u001b[39;49m\u001b[43m]\u001b[49m\u001b[43m,\u001b[49m\n\u001b[32m   1355\u001b[39m \u001b[43m    \u001b[49m\u001b[43mmetadata\u001b[49m\u001b[43m.\u001b[49m\u001b[43mget\u001b[49m\u001b[43m(\u001b[49m\u001b[33;43m'\u001b[39;49m\u001b[33;43msharding_rules\u001b[39;49m\u001b[33;43m'\u001b[39;49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[38;5;28;43;01mNone\u001b[39;49;00m\u001b[43m)\u001b[49m\u001b[43m,\u001b[49m\n\u001b[32m   1356\u001b[39m \u001b[43m    \u001b[49m\u001b[43mmetadata\u001b[49m\u001b[43m.\u001b[49m\u001b[43mget\u001b[49m\u001b[43m(\u001b[49m\u001b[33;43m'\u001b[39;49m\u001b[33;43mmesh\u001b[39;49m\u001b[33;43m'\u001b[39;49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[38;5;28;43;01mNone\u001b[39;49;00m\u001b[43m)\u001b[49m\u001b[43m,\u001b[49m\n\u001b[32m   1357\u001b[39m \u001b[43m  \u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m   1358\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m ref:\n\u001b[32m   1359\u001b[39m   value = jax.new_ref(value)  \u001b[38;5;66;03m# type: ignore\u001b[39;00m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/core/spmd.py:61\u001b[39m, in \u001b[36mshard_value\u001b[39m\u001b[34m(value, sharding, sharding_rules, mesh)\u001b[39m\n\u001b[32m     56\u001b[39m   \u001b[38;5;28;01mraise\u001b[39;00m \u001b[38;5;167;01mValueError\u001b[39;00m(\n\u001b[32m     57\u001b[39m     \u001b[33m'\u001b[39m\u001b[33mAn auto mesh context or metadata is required if creating a variable\u001b[39m\u001b[33m'\u001b[39m\n\u001b[32m     58\u001b[39m     \u001b[33mf\u001b[39m\u001b[33m'\u001b[39m\u001b[33m with annotation \u001b[39m\u001b[38;5;132;01m{\u001b[39;00msharding\u001b[38;5;132;01m=}\u001b[39;00m\u001b[33m. \u001b[39m\u001b[33m'\u001b[39m\n\u001b[32m     59\u001b[39m     \u001b[33m'\u001b[39m\u001b[33mFor more guidance, see https://flax.readthedocs.io/en/latest/flip/4844-var-eager-sharding.html.\u001b[39m\u001b[33m'\u001b[39m)\n\u001b[32m     60\u001b[39m pspec = get_pspec(sharding, sharding_rules)\n\u001b[32m---> \u001b[39m\u001b[32m61\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43m_apply_sharding\u001b[49m\u001b[43m(\u001b[49m\u001b[43mvalue\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mNamedSharding\u001b[49m\u001b[43m(\u001b[49m\u001b[43mmesh\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mpspec\u001b[49m\u001b[43m)\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mmesh\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/flax/core/spmd.py:37\u001b[39m, in \u001b[36m_apply_sharding\u001b[39m\u001b[34m(value, sharding, mesh)\u001b[39m\n\u001b[32m     35\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34m_apply_sharding\u001b[39m(value, sharding, mesh):\n\u001b[32m     36\u001b[39m   \u001b[38;5;28;01mif\u001b[39;00m mesh.are_all_axes_explicit:\n\u001b[32m---> \u001b[39m\u001b[32m37\u001b[39m     \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mjax\u001b[49m\u001b[43m.\u001b[49m\u001b[43msharding\u001b[49m\u001b[43m.\u001b[49m\u001b[43mreshard\u001b[49m\u001b[43m(\u001b[49m\u001b[43mvalue\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43msharding\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m     38\u001b[39m   \u001b[38;5;28;01melif\u001b[39;00m mesh.are_all_axes_auto:\n\u001b[32m     39\u001b[39m     \u001b[38;5;28;01mreturn\u001b[39;00m jax.lax.with_sharding_constraint(value, sharding)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/pjit.py:2256\u001b[39m, in \u001b[36mreshard\u001b[39m\u001b[34m(xs, out_shardings)\u001b[39m\n\u001b[32m   2252\u001b[39m   ds = ds.update(spec=ds.spec._normalized_spec_for_aval(x_aval.ndim))  \u001b[38;5;66;03m# pytype: disable=attribute-error\u001b[39;00m\n\u001b[32m   2253\u001b[39m   cmesh = (s.mesh \u001b[38;5;28;01mif\u001b[39;00m (\u001b[38;5;28misinstance\u001b[39m(s, NamedSharding) \u001b[38;5;129;01mand\u001b[39;00m\n\u001b[32m   2254\u001b[39m                       \u001b[38;5;28misinstance\u001b[39m(s.mesh, mesh_lib.Mesh))\n\u001b[32m   2255\u001b[39m            \u001b[38;5;28;01melse\u001b[39;00m \u001b[38;5;28;01mNone\u001b[39;00m)\n\u001b[32m-> \u001b[39m\u001b[32m2256\u001b[39m   out_flat.append(\u001b[43mreshard_p\u001b[49m\u001b[43m.\u001b[49m\u001b[43mbind\u001b[49m\u001b[43m(\u001b[49m\u001b[43mx\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mdst_sharding\u001b[49m\u001b[43m=\u001b[49m\u001b[43mds\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mconcrete_mesh\u001b[49m\u001b[43m=\u001b[49m\u001b[43mcmesh\u001b[49m\u001b[43m)\u001b[49m)\n\u001b[32m   2257\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m tree_unflatten(treedef, out_flat)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:632\u001b[39m, in \u001b[36mPrimitive.bind\u001b[39m\u001b[34m(self, *args, **params)\u001b[39m\n\u001b[32m    630\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34mbind\u001b[39m(\u001b[38;5;28mself\u001b[39m, *args, **params):\n\u001b[32m    631\u001b[39m   args = args \u001b[38;5;28;01mif\u001b[39;00m \u001b[38;5;28mself\u001b[39m.skip_canonicalization \u001b[38;5;28;01melse\u001b[39;00m \u001b[38;5;28mmap\u001b[39m(canonicalize_value, args)\n\u001b[32m--> \u001b[39m\u001b[32m632\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[38;5;28;43mself\u001b[39;49m\u001b[43m.\u001b[49m\u001b[43m_true_bind\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mparams\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:648\u001b[39m, in \u001b[36mPrimitive._true_bind\u001b[39m\u001b[34m(self, *args, **params)\u001b[39m\n\u001b[32m    646\u001b[39m trace_ctx.set_trace(eval_trace)\n\u001b[32m    647\u001b[39m \u001b[38;5;28;01mtry\u001b[39;00m:\n\u001b[32m--> \u001b[39m\u001b[32m648\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[38;5;28;43mself\u001b[39;49m\u001b[43m.\u001b[49m\u001b[43mbind_with_trace\u001b[49m\u001b[43m(\u001b[49m\u001b[43mprev_trace\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mparams\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m    649\u001b[39m \u001b[38;5;28;01mfinally\u001b[39;00m:\n\u001b[32m    650\u001b[39m   trace_ctx.set_trace(prev_trace)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:660\u001b[39m, in \u001b[36mPrimitive.bind_with_trace\u001b[39m\u001b[34m(self, trace, args, params)\u001b[39m\n\u001b[32m    658\u001b[39m     \u001b[38;5;28;01mwith\u001b[39;00m set_current_trace(trace):\n\u001b[32m    659\u001b[39m       \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[38;5;28mself\u001b[39m.to_lojax(*args, **params)  \u001b[38;5;66;03m# type: ignore\u001b[39;00m\n\u001b[32m--> \u001b[39m\u001b[32m660\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mtrace\u001b[49m\u001b[43m.\u001b[49m\u001b[43mprocess_primitive\u001b[49m\u001b[43m(\u001b[49m\u001b[38;5;28;43mself\u001b[39;49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mparams\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m    661\u001b[39m trace.process_primitive(\u001b[38;5;28mself\u001b[39m, args, params)  \u001b[38;5;66;03m# may raise lojax error\u001b[39;00m\n\u001b[32m    662\u001b[39m \u001b[38;5;28;01mraise\u001b[39;00m \u001b[38;5;167;01mException\u001b[39;00m(\u001b[33mf\u001b[39m\u001b[33m\"\u001b[39m\u001b[33mcouldn\u001b[39m\u001b[33m'\u001b[39m\u001b[33mt apply typeof to args: \u001b[39m\u001b[38;5;132;01m{\u001b[39;00margs\u001b[38;5;132;01m}\u001b[39;00m\u001b[33m\"\u001b[39m)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:1205\u001b[39m, in \u001b[36mEvalTrace.process_primitive\u001b[39m\u001b[34m(self, primitive, args, params)\u001b[39m\n\u001b[32m   1203\u001b[39m args = \u001b[38;5;28mmap\u001b[39m(full_lower, args)\n\u001b[32m   1204\u001b[39m check_eval_args(args)\n\u001b[32m-> \u001b[39m\u001b[32m1205\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mprimitive\u001b[49m\u001b[43m.\u001b[49m\u001b[43mimpl\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mparams\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/pjit.py:2273\u001b[39m, in \u001b[36m_reshard_impl\u001b[39m\u001b[34m(x, dst_sharding, concrete_mesh)\u001b[39m\n\u001b[32m   2270\u001b[39m thunk = \u001b[38;5;28;01mlambda\u001b[39;00m: dispatch.apply_primitive(\n\u001b[32m   2271\u001b[39m     reshard_p, x, dst_sharding=dst_sharding, concrete_mesh=concrete_mesh)\n\u001b[32m   2272\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m concrete_mesh \u001b[38;5;129;01mis\u001b[39;00m \u001b[38;5;28;01mNone\u001b[39;00m:\n\u001b[32m-> \u001b[39m\u001b[32m2273\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mthunk\u001b[49m\u001b[43m(\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m   2274\u001b[39m \u001b[38;5;28;01melse\u001b[39;00m:\n\u001b[32m   2275\u001b[39m   \u001b[38;5;28;01mwith\u001b[39;00m sharding_impls.set_mesh(concrete_mesh):\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/pjit.py:2270\u001b[39m, in \u001b[36m_reshard_impl.<locals>.<lambda>\u001b[39m\u001b[34m()\u001b[39m\n\u001b[32m   2269\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34m_reshard_impl\u001b[39m(x, *, dst_sharding, concrete_mesh):\n\u001b[32m-> \u001b[39m\u001b[32m2270\u001b[39m   thunk = \u001b[38;5;28;01mlambda\u001b[39;00m: \u001b[43mdispatch\u001b[49m\u001b[43m.\u001b[49m\u001b[43mapply_primitive\u001b[49m\u001b[43m(\u001b[49m\n\u001b[32m   2271\u001b[39m \u001b[43m      \u001b[49m\u001b[43mreshard_p\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mx\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mdst_sharding\u001b[49m\u001b[43m=\u001b[49m\u001b[43mdst_sharding\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mconcrete_mesh\u001b[49m\u001b[43m=\u001b[49m\u001b[43mconcrete_mesh\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m   2272\u001b[39m   \u001b[38;5;28;01mif\u001b[39;00m concrete_mesh \u001b[38;5;129;01mis\u001b[39;00m \u001b[38;5;28;01mNone\u001b[39;00m:\n\u001b[32m   2273\u001b[39m     \u001b[38;5;28;01mreturn\u001b[39;00m thunk()\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/dispatch.py:91\u001b[39m, in \u001b[36mapply_primitive\u001b[39m\u001b[34m(prim, *args, **params)\u001b[39m\n\u001b[32m     89\u001b[39m prev = config.disable_jit.swap_local(\u001b[38;5;28;01mFalse\u001b[39;00m)\n\u001b[32m     90\u001b[39m \u001b[38;5;28;01mtry\u001b[39;00m:\n\u001b[32m---> \u001b[39m\u001b[32m91\u001b[39m   outs = \u001b[43mfun\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m     92\u001b[39m \u001b[38;5;28;01mfinally\u001b[39;00m:\n\u001b[32m     93\u001b[39m   config.disable_jit.set_local(prev)\n",
+      "    \u001b[31m[... skipping hidden 1 frame]\u001b[39m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/pjit.py:257\u001b[39m, in \u001b[36m_cpp_pjit.<locals>.cache_miss\u001b[39m\u001b[34m(*args, **kwargs)\u001b[39m\n\u001b[32m    254\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m config.no_tracing.value:\n\u001b[32m    255\u001b[39m   \u001b[38;5;28;01mraise\u001b[39;00m \u001b[38;5;167;01mRuntimeError\u001b[39;00m(\u001b[33mf\u001b[39m\u001b[33m\"\u001b[39m\u001b[33mre-tracing function \u001b[39m\u001b[38;5;132;01m{\u001b[39;00mjit_info.fun_sourceinfo\u001b[38;5;132;01m}\u001b[39;00m\u001b[33m for \u001b[39m\u001b[33m\"\u001b[39m\n\u001b[32m    256\u001b[39m                      \u001b[33m\"\u001b[39m\u001b[33m`jit`, but \u001b[39m\u001b[33m'\u001b[39m\u001b[33mno_tracing\u001b[39m\u001b[33m'\u001b[39m\u001b[33m is set\u001b[39m\u001b[33m\"\u001b[39m)\n\u001b[32m--> \u001b[39m\u001b[32m257\u001b[39m p, args_flat = \u001b[43m_trace_for_jit\u001b[49m\u001b[43m(\u001b[49m\u001b[43mfun\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mjit_info\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m    258\u001b[39m (outs, out_flat, out_tree, args_flat, jaxpr,\n\u001b[32m    259\u001b[39m  executable, pgle_profiler, const_args) = _run_python_pjit(\n\u001b[32m    260\u001b[39m      p, args_flat, fun, jit_info, args, kwargs)\n\u001b[32m    262\u001b[39m maybe_fastpath_data = _get_fastpath_data(\n\u001b[32m    263\u001b[39m     executable, out_tree, args_flat, out_flat, jaxpr.effects, jaxpr.consts,\n\u001b[32m    264\u001b[39m     pgle_profiler, const_args)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/pjit.py:544\u001b[39m, in \u001b[36m_trace_for_jit\u001b[39m\u001b[34m(fun, ji, args, kwargs)\u001b[39m\n\u001b[32m    542\u001b[39m       jaxpr, out_avals = pe.trace_to_jaxpr(fun, in_type, dbg, qdd_token)\n\u001b[32m    543\u001b[39m   \u001b[38;5;28;01melse\u001b[39;00m:\n\u001b[32m--> \u001b[39m\u001b[32m544\u001b[39m     jaxpr, out_avals = \u001b[43mpe\u001b[49m\u001b[43m.\u001b[49m\u001b[43mtrace_to_jaxpr\u001b[49m\u001b[43m(\u001b[49m\u001b[43mfun\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43min_type\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mdbg\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mqdd_token\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m    546\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m config.debug_key_reuse.value:\n\u001b[32m    547\u001b[39m   \u001b[38;5;66;03m# Import here to avoid circular imports\u001b[39;00m\n\u001b[32m    548\u001b[39m   \u001b[38;5;28;01mfrom\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34;01mjax\u001b[39;00m\u001b[34;01m.\u001b[39;00m\u001b[34;01mexperimental\u001b[39;00m\u001b[34;01m.\u001b[39;00m\u001b[34;01mkey_reuse\u001b[39;00m\u001b[34;01m.\u001b[39;00m\u001b[34;01m_core\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;28;01mimport\u001b[39;00m check_key_reuse_jaxpr  \u001b[38;5;66;03m# pytype: disable=import-error\u001b[39;00m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/interpreters/partial_eval.py:2412\u001b[39m, in \u001b[36mtrace_to_jaxpr\u001b[39m\u001b[34m(***failed resolving arguments***)\u001b[39m\n\u001b[32m   2410\u001b[39m \u001b[38;5;28;01mwith\u001b[39;00m core.set_current_trace(trace):\n\u001b[32m   2411\u001b[39m   args, kwargs = in_tracers.unflatten()\n\u001b[32m-> \u001b[39m\u001b[32m2412\u001b[39m   ans_pytree = \u001b[43mfun\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m   2413\u001b[39m   debug_info = debug_info.set_result_paths(ans_pytree)\n\u001b[32m   2414\u001b[39m   ans = FlatTree.flatten(ans_pytree)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/dispatch.py:106\u001b[39m, in \u001b[36mxla_primitive_callable.<locals>.prim_fun\u001b[39m\u001b[34m(*args)\u001b[39m\n\u001b[32m    104\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34mprim_fun\u001b[39m(*args):\n\u001b[32m    105\u001b[39m   \u001b[38;5;28;01mwith\u001b[39;00m config.eager_constant_folding(\u001b[38;5;28;01mFalse\u001b[39;00m):\n\u001b[32m--> \u001b[39m\u001b[32m106\u001b[39m     \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mprim\u001b[49m\u001b[43m.\u001b[49m\u001b[43mbind\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mparams\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:632\u001b[39m, in \u001b[36mPrimitive.bind\u001b[39m\u001b[34m(self, *args, **params)\u001b[39m\n\u001b[32m    630\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34mbind\u001b[39m(\u001b[38;5;28mself\u001b[39m, *args, **params):\n\u001b[32m    631\u001b[39m   args = args \u001b[38;5;28;01mif\u001b[39;00m \u001b[38;5;28mself\u001b[39m.skip_canonicalization \u001b[38;5;28;01melse\u001b[39;00m \u001b[38;5;28mmap\u001b[39m(canonicalize_value, args)\n\u001b[32m--> \u001b[39m\u001b[32m632\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[38;5;28;43mself\u001b[39;49m\u001b[43m.\u001b[49m\u001b[43m_true_bind\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mparams\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:648\u001b[39m, in \u001b[36mPrimitive._true_bind\u001b[39m\u001b[34m(self, *args, **params)\u001b[39m\n\u001b[32m    646\u001b[39m trace_ctx.set_trace(eval_trace)\n\u001b[32m    647\u001b[39m \u001b[38;5;28;01mtry\u001b[39;00m:\n\u001b[32m--> \u001b[39m\u001b[32m648\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[38;5;28;43mself\u001b[39;49m\u001b[43m.\u001b[49m\u001b[43mbind_with_trace\u001b[49m\u001b[43m(\u001b[49m\u001b[43mprev_trace\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mparams\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m    649\u001b[39m \u001b[38;5;28;01mfinally\u001b[39;00m:\n\u001b[32m    650\u001b[39m   trace_ctx.set_trace(prev_trace)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:660\u001b[39m, in \u001b[36mPrimitive.bind_with_trace\u001b[39m\u001b[34m(self, trace, args, params)\u001b[39m\n\u001b[32m    658\u001b[39m     \u001b[38;5;28;01mwith\u001b[39;00m set_current_trace(trace):\n\u001b[32m    659\u001b[39m       \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[38;5;28mself\u001b[39m.to_lojax(*args, **params)  \u001b[38;5;66;03m# type: ignore\u001b[39;00m\n\u001b[32m--> \u001b[39m\u001b[32m660\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mtrace\u001b[49m\u001b[43m.\u001b[49m\u001b[43mprocess_primitive\u001b[49m\u001b[43m(\u001b[49m\u001b[38;5;28;43mself\u001b[39;49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mparams\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m    661\u001b[39m trace.process_primitive(\u001b[38;5;28mself\u001b[39m, args, params)  \u001b[38;5;66;03m# may raise lojax error\u001b[39;00m\n\u001b[32m    662\u001b[39m \u001b[38;5;28;01mraise\u001b[39;00m \u001b[38;5;167;01mException\u001b[39;00m(\u001b[33mf\u001b[39m\u001b[33m\"\u001b[39m\u001b[33mcouldn\u001b[39m\u001b[33m'\u001b[39m\u001b[33mt apply typeof to args: \u001b[39m\u001b[38;5;132;01m{\u001b[39;00margs\u001b[38;5;132;01m}\u001b[39;00m\u001b[33m\"\u001b[39m)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/interpreters/partial_eval.py:2031\u001b[39m, in \u001b[36mDynamicJaxprTrace.process_primitive\u001b[39m\u001b[34m(self, primitive, tracers, params)\u001b[39m\n\u001b[32m   2028\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m primitive \u001b[38;5;129;01min\u001b[39;00m custom_staging_rules:\n\u001b[32m   2029\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m custom_staging_rules[primitive](\u001b[38;5;28mself\u001b[39m, source_info, *jaxpr_tracers,\n\u001b[32m   2030\u001b[39m                                          **params)\n\u001b[32m-> \u001b[39m\u001b[32m2031\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[38;5;28;43mself\u001b[39;49m\u001b[43m.\u001b[49m\u001b[43mdefault_process_primitive\u001b[49m\u001b[43m(\u001b[49m\n\u001b[32m   2032\u001b[39m \u001b[43m    \u001b[49m\u001b[43mprimitive\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mjaxpr_tracers\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mparams\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43msource_info\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/interpreters/partial_eval.py:2049\u001b[39m, in \u001b[36mDynamicJaxprTrace.default_process_primitive\u001b[39m\u001b[34m(self, primitive, tracers, params, source_info)\u001b[39m\n\u001b[32m   2047\u001b[39m \u001b[38;5;28;01melse\u001b[39;00m:\n\u001b[32m   2048\u001b[39m   \u001b[38;5;28;01mtry\u001b[39;00m:\n\u001b[32m-> \u001b[39m\u001b[32m2049\u001b[39m     out_avals, effs = \u001b[43m_cached_abstract_eval\u001b[49m\u001b[43m(\u001b[49m\u001b[43mprimitive\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43maval_qdds\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mparams\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m   2050\u001b[39m   \u001b[38;5;28;01mexcept\u001b[39;00m \u001b[38;5;167;01mException\u001b[39;00m \u001b[38;5;28;01mas\u001b[39;00m e:\n\u001b[32m   2051\u001b[39m     \u001b[38;5;66;03m# TODO(phawkins): remove this 3 months after the release of JAX v0.7.\u001b[39;00m\n\u001b[32m   2052\u001b[39m     _verify_params_are_hashable(primitive, params)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/util.py:466\u001b[39m, in \u001b[36mmulti_weakref_lru_cache.<locals>.wrapper\u001b[39m\u001b[34m(*orig_args, **orig_kwargs)\u001b[39m\n\u001b[32m    464\u001b[39m nr_weakrefs = \u001b[38;5;28mlen\u001b[39m(acc_weakrefs)\n\u001b[32m    465\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m nr_weakrefs == \u001b[32m0\u001b[39m:\n\u001b[32m--> \u001b[39m\u001b[32m466\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mcached_call\u001b[49m\u001b[43m(\u001b[49m\u001b[43m_multi_weakref_placeholder\u001b[49m\u001b[43m,\u001b[49m\n\u001b[32m    467\u001b[39m \u001b[43m                     \u001b[49m\u001b[43m*\u001b[49m\u001b[43morig_args\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43morig_kwargs\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m    468\u001b[39m \u001b[38;5;28;01melif\u001b[39;00m nr_weakrefs == \u001b[32m1\u001b[39m:\n\u001b[32m    469\u001b[39m   \u001b[38;5;66;03m# Put the single weakref first, and skip the MultiWeakRefCacheKey\u001b[39;00m\n\u001b[32m    470\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m cached_call(acc_weakrefs[\u001b[32m0\u001b[39m],\n\u001b[32m    471\u001b[39m                      *args, **kwargs)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/util.py:450\u001b[39m, in \u001b[36mmulti_weakref_lru_cache.<locals>.cache_miss\u001b[39m\u001b[34m(key, *args, **kwargs)\u001b[39m\n\u001b[32m    447\u001b[39m \u001b[38;5;28;01melse\u001b[39;00m:  \u001b[38;5;66;03m# had 1 weakref, we had put it first as the `key`\u001b[39;00m\n\u001b[32m    448\u001b[39m   orig_args, orig_kwargs = sentinel_to_referrents(\n\u001b[32m    449\u001b[39m       (args, kwargs), \u001b[38;5;28miter\u001b[39m([weakref.ref(key)]), \u001b[38;5;28;01mNone\u001b[39;00m)\n\u001b[32m--> \u001b[39m\u001b[32m450\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mcall\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43morig_args\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43morig_kwargs\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/interpreters/partial_eval.py:1860\u001b[39m, in \u001b[36m_cached_abstract_eval\u001b[39m\u001b[34m(primitive, *aval_qdds, **params)\u001b[39m\n\u001b[32m   1858\u001b[39m \u001b[38;5;129m@multi_weakref_lru_cache\u001b[39m\n\u001b[32m   1859\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34m_cached_abstract_eval\u001b[39m(primitive: core.Primitive, *aval_qdds, **params):\n\u001b[32m-> \u001b[39m\u001b[32m1860\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mprimitive\u001b[49m\u001b[43m.\u001b[49m\u001b[43mabstract_eval\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43maval_qdds\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mparams\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:702\u001b[39m, in \u001b[36m_effect_free_abstract_eval.<locals>.abstract_eval_\u001b[39m\u001b[34m(*args, **kwargs)\u001b[39m\n\u001b[32m    701\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34mabstract_eval_\u001b[39m(*args, **kwargs):\n\u001b[32m--> \u001b[39m\u001b[32m702\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mabstract_eval\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m, no_effects\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/pjit.py:2266\u001b[39m, in \u001b[36m_reshard_abstract_eval\u001b[39m\u001b[34m(aval, dst_sharding, concrete_mesh)\u001b[39m\n\u001b[32m   2264\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m aval.sharding == dst_sharding:\n\u001b[32m   2265\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m aval\n\u001b[32m-> \u001b[39m\u001b[32m2266\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43maval\u001b[49m\u001b[43m.\u001b[49m\u001b[43mupdate\u001b[49m\u001b[43m(\u001b[49m\u001b[43msharding\u001b[49m\u001b[43m=\u001b[49m\u001b[43mdst_sharding\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:2217\u001b[39m, in \u001b[36mShapedArray.update\u001b[39m\u001b[34m(self, shape, dtype, weak_type, **kwargs)\u001b[39m\n\u001b[32m   2215\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m \u001b[33m'\u001b[39m\u001b[33mmemory_space\u001b[39m\u001b[33m'\u001b[39m \u001b[38;5;129;01mnot\u001b[39;00m \u001b[38;5;129;01min\u001b[39;00m kwargs:\n\u001b[32m   2216\u001b[39m   kwargs[\u001b[33m'\u001b[39m\u001b[33mmemory_space\u001b[39m\u001b[33m'\u001b[39m] = \u001b[38;5;28mself\u001b[39m.memory_space\n\u001b[32m-> \u001b[39m\u001b[32m2217\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mShapedArray\u001b[49m\u001b[43m(\u001b[49m\u001b[43mshape\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mdtype\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mweak_type\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:2193\u001b[39m, in \u001b[36mShapedArray.__init__\u001b[39m\u001b[34m(self, shape, dtype, weak_type, sharding, vma, memory_space)\u001b[39m\n\u001b[32m   2191\u001b[39m \u001b[38;5;28mself\u001b[39m.weak_type = weak_type\n\u001b[32m   2192\u001b[39m \u001b[38;5;66;03m# The ShapedArray.sharding.memory_kind is always None; use memory_space.\u001b[39;00m\n\u001b[32m-> \u001b[39m\u001b[32m2193\u001b[39m \u001b[38;5;28mself\u001b[39m.sharding = \u001b[43mget_sharding\u001b[49m\u001b[43m(\u001b[49m\u001b[43msharding\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[38;5;28;43mself\u001b[39;49m\u001b[43m.\u001b[49m\u001b[43mshape\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m   2194\u001b[39m \u001b[38;5;66;03m# short for varying_manual_axes. See docs at\u001b[39;00m\n\u001b[32m   2195\u001b[39m \u001b[38;5;66;03m# https://docs.jax.dev/en/latest/notebooks/shard_map.html#tracking-how-values-vary-over-manual-mesh-axes-and-check-vma-true\u001b[39;00m\n\u001b[32m   2196\u001b[39m \u001b[38;5;28mself\u001b[39m.vma = get_vma(vma, \u001b[38;5;28mself\u001b[39m.sharding)\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/util.py:301\u001b[39m, in \u001b[36mcache.<locals>.wrap.<locals>.wrapper\u001b[39m\u001b[34m(*args, **kwargs)\u001b[39m\n\u001b[32m    299\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m config.check_tracer_leaks.value:\n\u001b[32m    300\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m f(*args, **kwargs)\n\u001b[32m--> \u001b[39m\u001b[32m301\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mcached\u001b[49m\u001b[43m(\u001b[49m\u001b[43mtrace_context\u001b[49m\u001b[43m(\u001b[49m\u001b[43m)\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/util.py:295\u001b[39m, in \u001b[36mcache.<locals>.wrap.<locals>.cached\u001b[39m\u001b[34m(_, *args, **kwargs)\u001b[39m\n\u001b[32m    293\u001b[39m \u001b[38;5;129m@functools\u001b[39m.lru_cache(max_size)\n\u001b[32m    294\u001b[39m \u001b[38;5;28;01mdef\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34mcached\u001b[39m(_, *args, **kwargs):\n\u001b[32m--> \u001b[39m\u001b[32m295\u001b[39m   \u001b[38;5;28;01mreturn\u001b[39;00m \u001b[43mf\u001b[49m\u001b[43m(\u001b[49m\u001b[43m*\u001b[49m\u001b[43margs\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43m*\u001b[49m\u001b[43m*\u001b[49m\u001b[43mkwargs\u001b[49m\u001b[43m)\u001b[49m\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:2139\u001b[39m, in \u001b[36mget_sharding\u001b[39m\u001b[34m(sharding, shape)\u001b[39m\n\u001b[32m   2136\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m \u001b[38;5;129;01mnot\u001b[39;00m \u001b[38;5;28misinstance\u001b[39m(out_s.mesh, mesh_lib.AbstractMesh):\n\u001b[32m   2137\u001b[39m   \u001b[38;5;28;01mraise\u001b[39;00m \u001b[38;5;167;01mValueError\u001b[39;00m(\u001b[33m\"\u001b[39m\u001b[33mMesh of an aval must be an AbstractMesh. \u001b[39m\u001b[33m\"\u001b[39m\n\u001b[32m   2138\u001b[39m                    \u001b[33mf\u001b[39m\u001b[33m\"\u001b[39m\u001b[33mGot \u001b[39m\u001b[38;5;132;01m{\u001b[39;00mout_s.mesh\u001b[38;5;132;01m}\u001b[39;00m\u001b[33m of type \u001b[39m\u001b[38;5;132;01m{\u001b[39;00m\u001b[38;5;28mtype\u001b[39m(out_s.mesh)\u001b[38;5;132;01m}\u001b[39;00m\u001b[33m\"\u001b[39m)\n\u001b[32m-> \u001b[39m\u001b[32m2139\u001b[39m \u001b[43m_check_divisibility\u001b[49m\u001b[43m(\u001b[49m\u001b[43mout_s\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mshape\u001b[49m\u001b[43m)\u001b[49m\n\u001b[32m   2140\u001b[39m \u001b[38;5;28;01massert\u001b[39;00m out_s.memory_kind \u001b[38;5;129;01mis\u001b[39;00m \u001b[38;5;28;01mNone\u001b[39;00m\n\u001b[32m   2141\u001b[39m \u001b[38;5;28;01mreturn\u001b[39;00m out_s\n",
+      "\u001b[36mFile \u001b[39m\u001b[32m~/repos/flax/.venv/lib/python3.11/site-packages/jax/_src/core.py:2111\u001b[39m, in \u001b[36m_check_divisibility\u001b[39m\u001b[34m(sharding, shape)\u001b[39m\n\u001b[32m   2109\u001b[39m _, remainder = \u001b[38;5;28mdivmod\u001b[39m(sh, size)\n\u001b[32m   2110\u001b[39m \u001b[38;5;28;01mif\u001b[39;00m remainder != \u001b[32m0\u001b[39m:\n\u001b[32m-> \u001b[39m\u001b[32m2111\u001b[39m   \u001b[38;5;28;01mraise\u001b[39;00m \u001b[38;5;167;01mValueError\u001b[39;00m(\n\u001b[32m   2112\u001b[39m       \u001b[33mf\u001b[39m\u001b[33m\"\u001b[39m\u001b[33mSharding spec \u001b[39m\u001b[38;5;132;01m{\u001b[39;00mspec\u001b[38;5;132;01m}\u001b[39;00m\u001b[33m implies that array axis \u001b[39m\u001b[38;5;132;01m{\u001b[39;00mdim\u001b[38;5;132;01m}\u001b[39;00m\u001b[33m is partitioned\u001b[39m\u001b[33m\"\u001b[39m\n\u001b[32m   2113\u001b[39m       \u001b[33mf\u001b[39m\u001b[33m\"\u001b[39m\u001b[33m \u001b[39m\u001b[38;5;132;01m{\u001b[39;00msize\u001b[38;5;132;01m}\u001b[39;00m\u001b[33m times, but does not evenly divide the dimension size \u001b[39m\u001b[38;5;132;01m{\u001b[39;00msh\u001b[38;5;132;01m}\u001b[39;00m\u001b[33m.\u001b[39m\u001b[33m\"\u001b[39m\n\u001b[32m   2114\u001b[39m       \u001b[33mf\u001b[39m\u001b[33m\"\u001b[39m\u001b[33m Got shape: \u001b[39m\u001b[38;5;132;01m{\u001b[39;00mshape\u001b[38;5;132;01m}\u001b[39;00m\u001b[33m and sharding \u001b[39m\u001b[38;5;132;01m{\u001b[39;00msharding\u001b[38;5;132;01m}\u001b[39;00m\u001b[33m\"\u001b[39m)\n",
+      "\u001b[31mValueError\u001b[39m: Sharding spec ('model',) implies that array axis 0 is partitioned 4 times, but does not evenly divide the dimension size 2. Got shape: (2, 1024, 1024) and sharding NamedSharding(mesh=AbstractMesh('data': 2, 'model': 4, axis_types=(Explicit, Explicit), device_kind=cpu, num_cores=None), spec=PartitionSpec('model', None, None))"
      ]
     }
    ],
@@ -392,7 +493,7 @@
     "\n",
     "  loss, grads = jax.value_and_grad(loss_fn)(model)\n",
     "  optimizer.update(model, grads)\n",
-    "  return model, loss\n",
+    "  return model, optimizer, loss\n",
     "\n",
     "\n",
     "with jax.set_mesh(auto_mesh):\n",
@@ -401,11 +502,12 @@
     "  label = jax.device_put(rngs.normal((8, 1024)), P('data', None))\n",
     "  # Model and optimizer\n",
     "  model = MultiDotReluDot(1024, 2, rngs=nnx.Rngs(0))\n",
+    "  print(model)\n",
     "  optimizer = nnx.Optimizer(model, optax.adam(1e-3), wrt=nnx.Param)\n",
     "\n",
     "  # The loop\n",
     "  for i in range(5):\n",
-    "    model, loss = train_step(model, optimizer, input, label)\n",
+    "    model, optimizer, loss = train_step(model, optimizer, input, label)\n",
     "    print(loss)    # Model (over-)fitting to the labels quickly."
    ]
   },
@@ -420,7 +522,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 9,
+   "execution_count": null,
    "metadata": {},
    "outputs": [
     {
@@ -455,15 +557,18 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 10,
+   "execution_count": null,
    "metadata": {},
    "outputs": [
     {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "PartitionSpec(None, None, 'model')\n",
-      "(2, 1024, 1024)\n"
+     "ename": "NameError",
+     "evalue": "name 'model' is not defined",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[31m---------------------------------------------------------------------------\u001b[39m",
+      "\u001b[31mNameError\u001b[39m                                 Traceback (most recent call last)",
+      "\u001b[36mCell\u001b[39m\u001b[36m \u001b[39m\u001b[32mIn[6]\u001b[39m\u001b[32m, line 4\u001b[39m\n\u001b[32m      1\u001b[39m \u001b[38;5;28;01mimport\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34;01morbax\u001b[39;00m\u001b[34;01m.\u001b[39;00m\u001b[34;01mcheckpoint\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[38;5;28;01mas\u001b[39;00m\u001b[38;5;250m \u001b[39m\u001b[34;01mocp\u001b[39;00m\n\u001b[32m      3\u001b[39m \u001b[38;5;66;03m# Save the sharded state.\u001b[39;00m\n\u001b[32m----> \u001b[39m\u001b[32m4\u001b[39m sharded_state = nnx.state(\u001b[43mmodel\u001b[49m)\n\u001b[32m      5\u001b[39m path = ocp.test_utils.erase_and_create_empty(\u001b[33m'\u001b[39m\u001b[33m/tmp/my-checkpoints/\u001b[39m\u001b[33m'\u001b[39m)\n\u001b[32m      6\u001b[39m checkpointer = ocp.StandardCheckpointer()\n",
+      "\u001b[31mNameError\u001b[39m: name 'model' is not defined"
      ]
     }
    ],
@@ -477,8 +582,9 @@
     "checkpointer.save(path / 'checkpoint_name', sharded_state)\n",
     "\n",
     "# Load a sharded state from the checkpoint.\n",
-    "graphdef, abs_state = nnx.get_abstract_model(\n",
+    "abs_model = nnx.eval_shape(\n",
     "  lambda: MultiDotReluDot(1024, 2, rngs=nnx.Rngs(0)), auto_mesh)\n",
+    "graphdef, abs_state = nnx.split(abs_model)\n",
     "restored_state = checkpointer.restore(path / 'checkpoint_name',\n",
     "                                      target=abs_state)\n",
     "restored_model = nnx.merge(graphdef, abs_state)\n",
@@ -500,7 +606,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 11,
+   "execution_count": null,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -551,7 +657,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 12,
+   "execution_count": null,
    "metadata": {},
    "outputs": [],
    "source": [
@@ -683,7 +789,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 14,
+   "execution_count": null,
    "metadata": {},
    "outputs": [
     {
diff --git a/docs_nnx/guides/flax_gspmd.md b/docs_nnx/guides/flax_gspmd.md
index 90a7fade5..f7fecc07f 100644
--- a/docs_nnx/guides/flax_gspmd.md
+++ b/docs_nnx/guides/flax_gspmd.md
@@ -33,6 +33,8 @@ import flax
 from flax import nnx
 
 # Ignore this if you are already running on a TPU or GPU
+nnx.set_graph_mode(False)
+nnx.set_graph_updates(False)
 if not jax._src.xla_bridge.backends_are_initialized():
   jax.config.update('jax_num_cpu_devices', 8)
 print(f'You have 8 “fake” JAX devices now: {jax.devices()}')
@@ -50,7 +52,6 @@ auto_mesh = jax.make_mesh((2, 4), ('data', 'model'))
 > Compatibility Note: This guide covers the [eager sharding feature](https://flax.readthedocs.io/en/latest/flip/4844-var-eager-sharding.html) that greatly simplifies creating sharded model. If your project already used Flax GSPMD API on version `flax<0.12`, you might have turned the feature off to keep your code working. Users can toggle this feature using the `nnx.use_eager_sharding` function.
 
 ```{code-cell} ipython3
-nnx.use_eager_sharding(True)
 assert nnx.using_eager_sharding()
 ```
 
@@ -64,7 +65,7 @@ with nnx.use_eager_sharding(False):
 You can also enable eager sharding on a per-variable basis by passing `eager_sharding=False` during variable initialization. The mesh can also be passed this way.
 
 ```{code-cell} ipython3
-nnx.Param(jnp.ones(4,4), out_sharding=(None, 'model'), eager_sharding=True, mesh=auto_mesh)
+nnx.Param(jnp.ones((4, 4)), out_sharding=(None, 'model'), eager_sharding=True, mesh=auto_mesh)
 ```
 
 ## Shard a single-array model
@@ -141,15 +142,14 @@ Make note of the following:
 ```{code-cell} ipython3
 class DotReluDot(nnx.Module):
   def __init__(self, depth: int, rngs: nnx.Rngs):
-    init_fn = nnx.initializers.lecun_normal()
     self.dot1 = nnx.Linear(
       depth, depth,
-      kernel_init=nnx.with_partitioning(init_fn, (None, 'model')),
+      kernel_metadata={'out_sharding': (None, 'model')},
       use_bias=False,  # or use `bias_init` to give it annotation too
       rngs=rngs)
     self.w2 = nnx.Param(
-      init_fn(rngs.params(), (depth, depth)),  # RNG key and shape for W2 creation
-      sharding=('model', None),
+      rngs.params.lecun_normal()((depth, depth)),  # RNG key and shape for W2 creation
+      out_sharding=('model', None),
     )
 
   def __call__(self, x: jax.Array):
@@ -163,7 +163,8 @@ class MultiDotReluDot(nnx.Module):
   def __init__(self, depth: int, num_layers: int, rngs: nnx.Rngs):
     # Annotate the additional axis with sharding=None, meaning it will be
     # replicated across all devices.
-    @nnx.vmap(transform_metadata={nnx.PARTITION_NAME: None})
+    @nnx.vmap
+    @nnx.transform_metadata(partition=None)
     def create_sublayers(r):
       return DotReluDot(depth, r)
     self.layers = create_sublayers(rngs.fork(split=num_layers))
@@ -186,7 +187,7 @@ def train_step(model, optimizer, x, y):
 
   loss, grads = jax.value_and_grad(loss_fn)(model)
   optimizer.update(model, grads)
-  return model, loss
+  return model, optimizer, loss
 
 
 with jax.set_mesh(auto_mesh):
@@ -195,11 +196,12 @@ with jax.set_mesh(auto_mesh):
   label = jax.device_put(rngs.normal((8, 1024)), P('data', None))
   # Model and optimizer
   model = MultiDotReluDot(1024, 2, rngs=nnx.Rngs(0))
+  print(model)
   optimizer = nnx.Optimizer(model, optax.adam(1e-3), wrt=nnx.Param)
 
   # The loop
   for i in range(5):
-    model, loss = train_step(model, optimizer, input, label)
+    model, optimizer, loss = train_step(model, optimizer, input, label)
     print(loss)    # Model (over-)fitting to the labels quickly.
 ```
 
@@ -234,8 +236,9 @@ checkpointer = ocp.StandardCheckpointer()
 checkpointer.save(path / 'checkpoint_name', sharded_state)
 
 # Load a sharded state from the checkpoint.
-graphdef, abs_state = nnx.get_abstract_model(
+abs_model = nnx.eval_shape(
   lambda: MultiDotReluDot(1024, 2, rngs=nnx.Rngs(0)), auto_mesh)
+graphdef, abs_state = nnx.split(abs_model)
 restored_state = checkpointer.restore(path / 'checkpoint_name',
                                       target=abs_state)
 restored_model = nnx.merge(graphdef, abs_state)
diff --git a/docs_nnx/nnx_basics_tree.ipynb b/docs_nnx/nnx_basics_tree.ipynb
new file mode 100644
index 000000000..ee63ff443
--- /dev/null
+++ b/docs_nnx/nnx_basics_tree.ipynb
@@ -0,0 +1,675 @@
+{
+ "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# NNX Basics\n",
+    "\n",
+    "NNX is a Neural Networks library for JAX. NNX provides the tools to structure modeling code as [JAX pytrees](https://jax.readthedocs.io/en/latest/pytrees.html) so it can work with transforms, `jax.tree.*` utilities, and all standard JAX APIs. This guide covers the core concepts you need to get started."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 1,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "<flax.nnx.graphlib.set_graph_updates at 0x117f623d0>"
+      ]
+     },
+     "execution_count": 1,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "from flax import nnx\n",
+    "import jax\n",
+    "import jax.numpy as jnp\n",
+    "\n",
+    "nnx.graphlib.set_graph_mode(False)\n",
+    "nnx.graphlib.set_graph_updates(False)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "NNX's main build blocks are:\n",
+    "\n",
+    "- **`nnx.Pytree`**: Base class for pytree-compatible objects. Defines the tree structure of your model.\n",
+    "- **`nnx.Variable`**: Wraps array data and tracks mutable state. Subclasses like `nnx.Param` categorize different kinds of state.\n",
+    "- **State APIs** (`nnx.{state, split, merge, update}`): Extract, partition, reconstruct, and apply state updates.\n",
+    "- **NNX Transforms** (`nnx.{jit, grad, scan, ...}`): Thin wrappers over JAX transforms that automate state propagation."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Pytrees and Variables\n",
+    "\n",
+    "`nnx.Pytree` and `nnx.Variable` are two orthogonal systems. **Pytrees** define the structure of your model as a JAX-compatible tree. **Variables** wrap array data and enable expressing state updates via in-place mutation. \n",
+    "\n",
+    "`Pytree`s are python objects that define its tree structure dynamically through its attributes, these are split into two categories: **Static attributes** (e.g. `int`, `str`) are embedded in the tree structure definition and are not traced by JAX. **Data attributes** (e.g. `nnx.Variable`, `jax.Array`) are the leaves of the tree and are traced by JAX. For more details see the [Pytree guide](https://flax.readthedocs.io/en/latest/guides/pytree.html).\n",
+    "\n",
+    "Here's a typical layer definition:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 2,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/html": [
+       "<script> (()=>{ if (customElements.get('treescope-container') === undefined) { class TreescopeContainer extends HTMLElement { constructor() { super(); this.attachShadow({mode: \"open\"}); this.defns = {}; this.state = {}; } } customElements.define(\"treescope-container\", TreescopeContainer); } if (customElements.get('treescope-run-here') === undefined) { class RunHere extends HTMLElement { constructor() { super() } connectedCallback() { const run = child => { const fn = new Function(child.textContent); child.textContent = \"\"; fn.call(this); this.remove(); }; const child = this.querySelector(\"script\"); if (child) { run(child); } else { new MutationObserver(()=>{ run(this.querySelector(\"script\")); }).observe(this, {childList: true}); } } } customElements.define(\"treescope-run-here\", RunHere); } })(); </script> <treescope-container class=\"treescope_out_3f82b7b5d2eb4971a74d921d6273d53c\" style=\"display:block\"></treescope-container> <treescope-run-here><script type=\"application/octet-stream\"> const root = ( Array.from(document.getElementsByClassName( \"treescope_out_3f82b7b5d2eb4971a74d921d6273d53c\")) .filter((elt) => !elt.dataset.setup) )[0]; root.dataset.setup = 1; const msg = document.createElement(\"span\"); msg.style = \"color: #cccccc; font-family: monospace;\"; msg.textContent = \"(Loading...)\"; root.state.loadingMsg = msg; root.shadowRoot.appendChild(msg); root.state.chain = new Promise((resolve, reject) => { const observer = new IntersectionObserver((entries) => { for (const entry of entries) { if (entry.isIntersecting) { resolve(); observer.disconnect(); return; } } }, {rootMargin: \"1000px\"}); window.setTimeout(() => { observer.observe(root); }, 0); }); root.state.deferring = false; const _insertNode = (node) => { for (let oldScript of node.querySelectorAll(\"script\")) { let newScript = document.createElement(\"script\"); newScript.type = oldScript.type; newScript.textContent = oldScript.textContent; oldScript.parentNode.replaceChild(newScript, oldScript); } if (root.state.loadingMsg) { root.state.loadingMsg.remove(); root.state.loadingMsg = null; } root.shadowRoot.appendChild(node); }; root.defns.insertContent = ((contentNode, compressed) => { if (compressed) { root.state.deferring = true; } if (root.state.deferring) { root.state.chain = (async () => { await root.state.chain; if (compressed) { const encoded = contentNode.textContent; const blob = new Blob([ Uint8Array.from(atob(encoded), (m) => m.codePointAt(0)) ]); const reader = blob.stream().pipeThrough( new DecompressionStream(\"deflate\") ).pipeThrough( new TextDecoderStream(\"utf-8\") ).getReader(); const parts = []; while (true) { const step = await reader.read(); if (step.done) { break; } parts.push(step.value); } const tpl = document.createElement('template'); tpl.innerHTML = parts.join(\"\"); _insertNode(tpl.content); } else { _insertNode(contentNode.content); } })(); } else { _insertNode(contentNode.content); } }); </script></treescope-run-here><div style=\"display:none\"> <script type=\"application/octet-stream\" >eNrlWQtX2zgW/iuq5+yQLMTkHd5nnZAXLVAILZSdOVnZlm0RRza2khDm9L/vley8nbSdgXa6C+cQkK7uS7qfviuOQj52yYnKA0JCw/NJN/A8jv5AvhdSTj12gALiYk6H5BBZHuMZC/epOz5AfY95oY8NGB85lJOM/OMA+QGMuDTkGak6w8c+jDKPwbCOjZ4deANmZgzP9YKDaOkhiv/SXRAAfdTkzgGyKAcxxgnjh6hPWSYez2Wz/wBd3lMmpM+U2bDOC0wSZGDoEPnYNGEw4xKLH6C84QhvGMk4hNoOjOTUkrDHOKYQ3FR//EtmSEOqU5dyCBEPuDeVzVDGA8pCagizJJqN4/p8tBvl8Wiax0wwYGAzgLHQCKjPkUjE8Rb2fZcaWKR21zM4EWkKCO5vnaRS6eMTyDzYCzkyicVCdIy4Q0PVJvwatuXCM0kqrTpeyFU5D6ERjro+YSJkzRBaxaJ//54008LMdAlMs4HrHkYWVHCz43kMRlMjL+il0bwP3i0MiamFYU4NMeiTwPKCPmYGUZk3SqXlQQADqZUZlIkWHaFCPg16qIVSS16rLmE2d9DxMcoKkY2uB4QPAgZ5R8QNycwxZ8CEZ8uqQ4daXPgnBcQvn+F7jYUUHD9meiM1II8DEnKN0b7crkaA+yQV5SQtdByuGPIHoROl8TAhxomJ4yiMDVF+vQ/Ci2gjuWfbblS+XVlicFp9oUuMEJfvIDKEAx7vpPBO/q32yFgkXQkU4VAsrBouDsN3UMWx3pQy1dntwzFUJsY/pyGfcPzlGT852k0qAJMOkVR4rCzijII41iFS8nSsZBUo3YCvingMXIRkMJjaVAzJGUiJNZPYFSjGCO8k4HSxrgdkKM+PxJ9fynt5nM1CVLGA4fX7sHBOAssvEfySCD5gHk8dON6QBOkE+VicDfo6CeYUZvf3cqWyEIAoSBAQs+sDDBLHc80FQVwR3zEKyzAOEOUY0EQstkAc6xA+g7yswW/weUGsG2UMpE0agtHxBKeXBdEJcrFO3IMDnUBlkzmvDPl1mGgvguBMTmBwjN2Q26ktyiQw664nQH+tTZnRVcsmDnohwTacFra6Wm7G0pCDw9SJ1HmSmIdoAw2HGD1iptPon+mZD2Jp8qKJ/IKH8i45QFu/5Uu6sfUj3VtctNbJ8ndwUuyjMDwIQrGBvgc3KgkS7NLw5czKUpCGMhIDwnVn/GWszsLj5ImvWlFp2LVoEPKux7ri+CeU1qZSUvMlUU2JW4X+svvRji+7KKLq48AGDhS5IQv681+0Bnjoj/UB50A+kgBoNp10aBWkLElBIoGBJgv/RnJFU1kisFvnGE4FxS7qjPu654bocsBFvCaqRSvh0x9DYWRGRO8BGY2Qtw/3iyNpJ2YcllMcEnNKYX8hWfF9uHrMo9WSOmbVfdJfjjKqj4QokuFutlId4bBrwD0AiZ2uxxZfuD0mOL3J5tKaRZPzqUdDHKQyGRNznMEMNlaSk/T8sDAiGFeA2eQ0S7UoFyICGQM6nfEG/NtCmXoAG0OJ+WbRE2kSvaF93ws4Ziu69cDrEdYVIzMw+nJ255bN5XOyzZ9VwV/AMbNrAPs1A8JiVxf7C9C5KPhC6DpXOvFFulCqBnaNFDRBwMBz/pMkbWrIsVg/9ffVPInbssgT0+MQu/BiPnmPA+wy4LRdaBst+gRKFspkT5YJEHgseNEIBwwKrzsB9sleWBY2coUEQR8Y8B/TjjCIG0CBXnGS4qFMVpWwOutPD2TTiIOMHWCTwralUK5QMom9gzw40jZBWXCvbDg70REH6ioAQw6hOM0rvqwg68vANloB6Ek8n9WRA0dX0NwkjBVXHgBxokxEzuakwOo6RZEG2A0X+4CFX+aT335ZrLcwczQSIk8AGuZamZfwI8nEQipm/VdSKhYbHHWxsUIbNCyHyhZavWTBrzG2Vs8Lvm6IhhO90YIAj1Ur8PrQxBoD0TipouBDdYhd6HRT6bQaetDiShgQrar4VKMrW7SpX3lpK1tQFOnpw0DoEMLF6wEZoVqn0xHRdMSYeAuQk9Bpy66rM2ZG6j//iomCQSaA9O2kYb5NY+I1xI3HRvFDVFE0mmFgHKBB4KbEDXYg5ndHnmXlD3W4I8vFHTO73zy3taomv9pXmubJ36rXI/jZamhaXdv0Ve1rmt3z3prterU2+qRpN59qZ9p5u1rTGvZTu/XO4WH1nBK70Di9y79rlz8NO/6Avj8v3eTO7trXH8+Ht+fP/P240aht39q9G1o9zTr09GpwVjebD9mWvmsN26b/+LbsPN5SejU4Z02nZX3g2ody9SIoao0269XLxofBgG1flx6NsDcaWg139/HJrnt7tn42au7lWtou065L74LgLHe9bT9nr82sdmbl7ItKbdR8yNtZbzy4rlT69Vx51Lrbv7Rtn9z0xkXS1p9Lhh5cNjnW7Kv2xegUh+PwatBu393WGyPt/ZXf/mR+2N3dtis3lbsCz1pv3z9qwxLofKddVLTzkda3n68724P7DqnfPeWtsvF8UbxujUuDqvb2ufrgN/wCbV3V6tn7wftip8Ks6rt6q3He1+j23rCed1jOqWzrH0d3D6NWMDxtfqixB6tet/n2pXHvupXSfu1sVN1z9ovn581OoXmv2f126aF6tc9vmqS1X69W283CqV283v1kjHWtCXv68e2udtXEGjmvuVrruX5p33O7XH1vX162T6s9elUijepdrdowaNZ3As9ncDb8+/pp7jnX61g1izvjt6xl4kbYsrIX/Wb9olw1tcePH33Mw8593zQx3c9bz/vFD/Thsez3g/Kl96nWoUGzPzxrFjq3nUKjnjeqV9bNdsv1/GaxEY5K2H4s79F70rlw/VtWbbWJeR6Qwe1js9bP3TaCXqfzVMqXb2/DkQYepZF8CeSpLXmst8TV+B/4Ma1+bHo+8IJZScr3S1VVN0jsRDX7O+ja/CLkyAc1Sd0iVgm64XgwA6Uicrf43AkleOOJ8gWxmPyJsRDgQagQbFZQQDzClCOGh9TG3AtU0OzrHg5MdRRQTm6g8UvNdEGwsa7ZmxoQkpQyR3XFaxpYuaF9Apw4NXluXVkXkD7w1pWln3dQPpvNStoB4AsMJCWbtmS7c3xWmTkn2tUJgokHSAX9ghqYugBs3ENC+I1ENiAaDDgboDGFnBFsCjq+PZ+7+GXwC2+CgtpPHgUX332WSZJychTd0EeU+YP4plHknax7T0qikvj6hsno6gYn5OJFu4s3rXLyq8uF2yCxWW5hconBwmysIfp4J2lk6mg3jmFF74RMLKldeFxUTmA3auCAoK8oVUTV9A56jwPcF/8NgYGsHLmBRsyFESEiZBY9mVe/NWFzW4vDYqjrDt3FYWWlxVE2zSsnQLePE6KJ3j6Vk3zs0c5qNqYUD0JeuxXJKdua9WxbyGM1UR/HW98IEPK5OL2Fpg3lsaJCNAqSN/mxMtdqAhkQU+J9YLkThilZCgC1Dvwe+7l0Mtbvzmo+ARU2JbT0kyUUwlmbUZj7HikdHa+HoL+CON8TaSwXP6mMPQF5BkoKnrhUVxdzIEEiEX1ebXdH67Z29Of39c+j5hQefxgYys7m+Cu2mZrHyvR/QCXLzOrZvf1CpVAs5stlXNDLRVKskH3LwHnDWjKa9L+j+JglR/oAR0d2Y0mosDV9EpCCExHL9TAv5FP5HVRK/2rPjvAXNmuhv0yM1irm88V8qWxUsmbRrBBMLKOIDd3AlWLBIiXl5LWrNel+/jsl9cuFsPOtxbIJbF4PHaJOfy1GRNMvgxTLaABw8JGGgKL0WWpEDjWhVoHJotnzh3gX+VMH+idP3Nd/rDnTm1K/7r6b/ze8cgJd31ds42qNpDfftSvyPwlNeo2L9OsJkiHajf8BkrQYsmyivi8fkolct5Vy8ofwoqiN/FuwogUqYOzt5cxc2TD29/aLRWLskXxWt/J5UrCsXE7/IcSHMnFDJ93OL3gfv+4B3Hx7zIm86g3y018dP8+GvxLi/L9v8lTSpMOT/wIvid2T</script> <treescope-run-here><script type=\"application/octet-stream\"> const root = ( Array.from(document.getElementsByClassName( \"treescope_out_3f82b7b5d2eb4971a74d921d6273d53c\")) .filter((elt) => !elt.dataset['step0']) )[0]; root.dataset['step0'] = 1; root.defns.insertContent( this.parentNode.querySelector('script[type=\"application/octet-stream\"]'), true ); this.parentNode.remove(); </script></treescope-run-here> </div>"
+      ],
+      "text/plain": [
+       "<IPython.core.display.HTML object>"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div style=\"display:none\"> <script type=\"application/octet-stream\" >eNrtfet620ay4H89BaI4AWmRFECRoiRKms+XeJI5ceK1M5esjj4ZBJoUbBBgAFCiouH/c95j9wH2FfZRzpNsVV+A7kYDpGTnzLdf4snYRHdVdXVVdXd19e00CG+sLL+LyNluEGaLyLs7seIkJrtWGJztTpP0KiBTkqYkuJoO+v1Bf3joj5xgEIyIR6b+wPMnvjcaHEzJcPf8NFt4MfyN9M57Xpp6dzfhr1d+EudeGJPUurdur8OcdAHOJ1hQOveisbW2TMC9MJ4mgDKFlO7Um4cR8DZP4oRijy0/iZL0xPrSo3/G1txLZ2HcnSR5nsxPLKfXH5L5WC1xkZLm4sJ4scwv8rsFCCT14hnZvQQWbkiah74Xdb0onMXARRgEEVCahlFOgIcZUMsgn7TctpVAUWF+13J6w/aDCzu5Tm6ooKqkH0YvXs4nJAWCcZK3TqaJv8zaQHaSpAFJu6kXhMvsxDpYrD6NJPtNmUbyQicj+mfMizux3MXKypIoDMqshlJ7GUCSNNPtpUl7lIU8XACOYshja5FkYR4moDZvAjwsc0ibeP7HWZos46DLWaYFmRieRAALVLwgCOMZsyv/GsmGMWioS25InGeisNswyK9PQHt5F5mDrLGFnE2j5PbEugmzcIKGU63Wr90wDsgKSnYcp7mWk2S1ZS2TVTe79gIs2qH/w2rRCnV4Qh8SeNXNFSr4Om5gy49C/2Pg5d5DNBYlHkr0ak6yzJsRyXpEi16f7rO+5DRPCcn8ZEG66TLuXpMU0jI/DRe5RW3T9hYL4MFDCewnfk7ybgY43tw+38E/UGyWW4IL68xqtdrW2bl1v2NZ8N90GfuIagUkI2kIrfxX8leQxlELGw0AWFZK8mUaWzT1GdLpTdNk3vLyZAJAHas1pwTnPT8JyBsU5bO85bTbY8Be79QX8wrEkB/0y4IYq5O7nGTA56PKE0SmSBupxOTW4gVRWi1KvjdZTqFv5yi8ggxnE9ffxf8tPNNiHsQxYzkiufUCjWnuLd7++flLsMyxXpsZyV+AMYbxMllmFLh140VL0mFmCJiIJmqIFCdeRq5oa+hYyXSakZzxEU4thmqdnlmOwLAkeKiOM+apDLNMWVskyohE5PzMcmuIyJz1IhLP8mura/UrpN2eSlwQYyL286ygyIp8arXMpN322MTHay+/7oHcQWYFsXaFi7KcryyX8yNpOtUqdFEWcXnhXCJTLrDAyLWtPU7eqkOy9iyXI8raYYXNmgpzH1uYay5s0lRY/7GF9fXCuP1fpB1r1rEml+ZGexeD6+Q/S/0sjK/fEqDe4uV9JHe0z/8bN/soXLz2wLZT7/Z1GLN/8ZuT+LO3EGZZUM9yD8azd+ifBLyIFmDk3rK0YLTsL8LsVRjDwNCiWf/8JzMhGKpaq7a1jwjWqeWS7qDEKyq4EpalWXMBQGll4JkhsaeU2NMCBv9QgCiZtaql7nHsX9IclMK/Fslta8UAOla/3S5sey1ZcdH2FTlaZ0ofgPlMnlqGJn60GCb/2srq8IysiTMdsqi1kiF6UaplATX3Vi2hd85Qe1xT09MCouDyX/QPa3agLWwz1tmOpnmyWrQKE1BlAM2wNG+wnQJMVK1QfVEGiEqUtM8asiqWfU1wbPAAwUJfC7imJlM0PWwdY8l0BJZmOgUxaDGuo5pA0b1iU18Q7GXR2mHcbWqs+5ymoMVbliBiHE0+WVul0QtJlp8mU9UJoVwDEifzMAYfIy1sOIxbkgmYqq11fVwElAWpt+tsoCIaCqIralOY0nSnMmxUIBf+VmqTyJVDbGUUyJN36Ei/y1PwuNlYr/puxSAihi5liHmfziatJ/fp2npyP8O/Juv2e+Nwg/596mXgVs0eV6IEgdORGGY1dwDR67v9Q2ifKXTRvZE77MPvGf52Rn38PSk7qRLt3HL7R6XseWVsOgGyjSYtQOgkxlYEqlUU5ufRGy+HCVMMPhDoA/6768A0kSYVAyUouYVmGlKHD/45FSDcyYK0vb225qGlyS3Ac8CL8FIYSEHuAyP3AcgBbEHqg0yKDz7J7cWHSzkVCslXPeT/LfHzFnoXH4B3+CfsWG5H8vlKi1xXTIsxGoSzMKfO85s0nHspquqCwtpfTukfuwM/3eloNBnQn9PpaOoQ+rPve07fpz+Dw/6of0R/Hg8OR5OA/jzyh4eDid3hBMnBaOT3ac7EnwR99tMdTYg/tQGGiknn6x2BlEDlbDTF/1Fsj/gjcsQ5m0xGnIejYHrk8dTjo+ND+tMfTpxgyH4Ojv3jQcHZdDQ5DBg7wSSYHDH2j0ngkWHB2U7BnU+i6B3MooCl0ZhlaJMWmJlMw1llzhJAj/NjTF4AvujhqO2Bkum0pWPxKUyYQc8WBuVchhHsFB26MAjunFFoyQq5gdAmDFzaycfIv24Nh19h0KBtj3cMhgRFQUMcUW7YD/yvPW6mOXI0mpWGxemiE1zQZh8XhZ1eOB2r/O+yo2S4NNWtZnwWjMt2ZR6nCr2HEQoYBqDKfjHhtPUm73O3X/FeKqQElDLahNkP3g9s8tiWG3pF4nLH91D1GcjhoNAfDqk84N+2RPlRSgQRu5KI3Ut5/K1VS6EYt6LKZqy6si7bmgteTs1Bh9+BHmAic6cImmkQVQVyMQQWYD7esSq6q4rUNEx/LnU1jsyfrjkmYvfh6nlclrGsZs11H6U653ehulKiJiXUNZ/m9tjcVN0NjU5XER+4Apz48jGMd3lj1d8RcOcYBdP8nse204eq+6EKf7TKH630xga2KdOV2p/7IMz6zEvZ6yxbb6HOU8t5sDqd3586nSa5O49W54PJGtQpq650W4SC26puizn+w30PY4EVEkoe/lFNwGBNglPJpBTVrR9tL9osa5MjadkLDyYLOY8O25Xw2yd5lGqrEtkXtK+9lN1ODgL8LIENGFpJ8If3+fm9T30grImbmGRUhG06NG7TkQI3D1fB1sZJ596TpNYucRL7xkvz7PndSwQtJuZULvKEC+U3uqymgNr6HevAnAOCHW6EOOQQA/z3AAxoI+SQQ1KMwWMwDvDf4adhwr+HaC/l7FOOMYfxDc7jQaBTD7QkN1bmBX9ludYXWjyy9J4K7Dxdkg1WGJOZl4c3pFhCPC1XOAXM3JuBu70MlCUI3WeT4jW46lvg9LA/pl1xu5ctojBv2bbm6jEksVh5WjEsnmNyGhD0aoGwUKaOd6EQvpT7eJTyIqU7JK5SsiBenl0lU1ytXkaRMo4bAn8K2bG1txfqYx5v4VkO3HSsLAwI54FzyViWAoIVGQLgD3SbDpcOwLZV4EJytOuuVkbnqdqtGIJrTGQaW9Z2oqoZr5vK5cHGh5RKQbVijf4B7Qsr3kE5gnDllKNIRVvy71oPQXOGRHtqN3st1VG04irVDX5Sv36hVe/C7PuVkzxjhsEhvKyprkHBcv2NHY/sFsnBLgb8h6fxOT0N416RrcWwvXhrllLQjWBLcc/i4Ls4CH2StfRIdsjS8UcGdkJRtQ1IokO/4F0C7YTFWhIgWdATmLCFZUHOhY1+jH1JPRkYdUjqRbZsbLSM3mKZXQsEyqhtjD1VSeoeu2C92DTDq3nBUb1VmNmXl+rAJ4DPLA6VfQwXV7QfsrWlHond90/uDeDrEzWZxAEkvjfPxnnBpw8tl+GZqG7CsbqmsnBnEq5XNfO9jT6Y8vRFs8qCSJU9iviAGtmtuZd9JIGVLPO2/Sg2r6Ik+bhcVLgV6zfW119bX3DccBYnKU4QaW/ZoJ16vqrVYaaaLSdZDj4abbuFCTLeruhatX2pTRcFpypq3cyxwuEy/hgnt7HCXo3XIOHJhdWNS9vIHpugSfTo3ZmbbQ9RzG32fHPTKWg+pgVU7epBamNFaqxvq7WNOmtuITX6WtdNROTiTv90bmuTiiQiPZKmSdqy/8p4kft+m48jxp1dfBcAK+BDEsZi7qFsMH0GSn63IH5llfYKnD/v7q9xHkZ/Yxu+WwHB2B/dntyxPAomZCeNX3R7eAijzt2Pk4ykN3TzDt8HS9KMUDyR1WqBj5uGJCs2Mgt98fQL57IXSohvsXgwQKc6+vCt2K+99CNuuz+zJH57vyxJevcO/Fk/T9JnUdSy9a3bsuhZ5VrysoSYCpEIG4xWmGpCANJLyTy5Ia22yZSrEuoFYQaViNH30JXZse7XxV5hqEaWP4th4oAMvkq9OZE2gdcQT9gPWX/ClTHv7J4swyh4xveZvwpny1RTvk+jJaLWm0xFZfBqW+oqi7JpPpA/4TxNExbExkAPfsm7Xemu+udeRg4HJZCUWIF9yUJFCihNkyHpuPUahiadspYh4+AJBAwaBHQbOoeXEmXYlWi+EmiZJkPeGSDvjJBZBGNAYADXMmQcNYpWovjaThDJyw1X0BO+ISluAykRlGRNkkvyivrYuP7wneQAK1KtAxrvlP0UNmOqr3K7laxSGC2n7JiBNFJSANan6IceJCup7qLQCIfxRrLsVEItUYGZX+PcBPvVb9j4sIyz5WKRpDm4QQEd+dvV7erU7q7QWVILZedENKtsy0IrJJdEOMnlW+ExwV+mKfTWamJGFnQS48izGC2UVOzVLU22J4IPd3pSW9tjhgWwcZOXX8b+C36Q1T3xXezsp/wriWu9nmqN8yT3ohdJlGn1TqK/40EpWk/3ssxg1QGpVqZxmgAq9Tbuo8sAAHBKYCl0xuOYuCMXcnrgPYFPRX9SF0uAlRwxkZWuiVy38vdTILlHRQxl4U7/WDlGUdScUSvwFIMrJPc2udUkB5b7LQln13lFdHfbiu7uIaK7+wTR3TWLjleu/L1BdGXVJdkhYrvGFPmQ42Nc7R32wD9S7xYLvV/Xy0frrLcQkoYhSapa+AWVUwzex6V0BmhH59r3YOaWyUt3rSDxl3NoeD0/JV5OvokIfrVsBmoXx6joZ48eRMS936Vp7ll9PB4hdh8q4NdUsgU81YcZXhLqC4qL66RklSu8cqp8FRVyW3Y/oCwaOgm+45qeTfk3vjFbiROXMXtwP3F4QxWqrpG0CiJGzrflBng55Ny0dGXcn2dE4Tyr3ivf5w8FVuDn0nEAaXN/ZXc4392v7wyvrC+zPTH0BMizSWYqschUNyYUiN6qAZFmVhg2K+qMybe6llFRA9/QTrcco0Bwyz1u3taFY16/5w4k3QD/WpBsON5U/jHx3cFSO6UIO6VQOpbTc4ft8bbVUXjCxD08wLdfnsvbGAzn62V4SMhgOmFsUOFD7IwdPprLB3U2VcrpDbfQSIOGu1gdqmHklH1tCMLsGE53gPP+nX6CUgrr0g4Y5pRaD6yctyhI7J3JMwS5I37a3FGPdQ75FKIcTyR3BC2Q9U2OtqfiroS/a4bn3Vg59Ft4rDoi0DuneGjpXlo/4V4Bgy1Sa8GVn9IEAfCp43xRyOuyanQi0HimeMO8A7D+RNdvrBPriy/K7Bp6hp3scgRBG1sesMN9p7Jup9ioYoPmn8yZCm682CcvkmWcy7b3WKeKe0TCtsC/2ZOUWzg4mFr6ORRMOEQqbK1VKw6bar5ljyDzcX4mOWq4XFxZh9U+VdlUq6FWU5Odynt3I+/QNBXudFooM6DSqhFauxm/ZuFZ+5yAv/Wxful4rXW3mu2cFeIw7kfQSquUJY8b1k5114bSD6zqzfYxkyg6/2kwWeyi9s7KOU2tvdZa66rZWlGcK9VWV022qnysNtjpqslKa210ZbTRVb2NoZDQQs1SajchG81za3NR3NeVbpSrJqPcqS2hbrBW/zF04b0ojMnf+aTEHTcAZnmafCQ1i/l1lF94CwTOfll6KdkI/ZeEulr2HBd47d90iN1pHNh4ZU17TthCenFUrIsuWcfQ+22CKXKfyjboXlp/+hO6qbg3oQFD6lfrUOqGVNM46taOo+4f4+gf42jDOHr++cbRne0GT7dm8HT/GDx/14Pn+WcYPOnfcjCsvFGF5EqcohWTW/Fb3a8kZeCAbgpytPlStmChLtJWUnpglAy3nGyOjMmRu8oirR4RLCTBtia8wWUtvO/gru6YA50nSzcS0eADDcCIgQxv+XDHhhP2MtZdDZYqENznjNfXID7/iannckMuY/zlPUqXALmjdrfnyhAlRbclLMNtOHIss9kLEwfnsmWUSzHvzxZZEYvDjEgZ/4cGulU4xeK8qSFxSm/8wPCNgrRWoyho7ZjP75uq3KUQqvGbUvrYz5+zyVK3W6140+JSAUOZtTZ38zyolwTLaJmp8PT2pwKHfsl4ev3Kz68EvXHluGuSBto1XjLiPue7sk2/vIcMCewZ1nxEQ8F83j4Y0nm5WKR2lwazlvvf395EoOXJIoRPo4ncPd5E7rYykY3+qm4jMkKjkVRr+DgjURB/P0Yi7lnT46Mdyxjm7HB2yqDlZeMCZXklJsbzpXuCyi1YGLqMgxcw4QxqlwGD8MZuq3cphjGlKq3L6SsqrOCH06eUFTS24icW+ErS9ALPYjXSli5GtcdG0GIlcgtYvBr4Fb0ZmM7mxd3ANdB56sUZbjb/MQ1nLACQJwvoA6Z19GHgepMmC5Lmdy07nHsz0k0JWn8Yz/CKF7rnBoQU2O0tCHS74gLS7q9JMkcC7paIeNtYl16EnIFnQjEHi5UtxM3UoYr6ve9FfuvGS1taueg1P7mXl4nXi5U4FShTKjSxHSkGXkNLXE9LDxKgzMA9sIWxMPytlSSDK3Ki9ySjcEys2tXFZ13o/I7f76GsotZP7isd/5pe4Ngbkjn2s1BfUeEaej8lC4ncaitylV0MUfS9NyGRvLmDryrR9Dfa0Qc+tuD6+xzaBYWhITW6dB7hp7J+TlOEBeHlV++wIaH0F1I8TYZiNyU/p7dtI5zTc6EG0p3JRiy0YXb1kdQV2VQ0eG2bS5dlW07vEDvXqhLbaHEsQ20SbXEcZf3b7xmi9dFOVTf3miZJyC1CXNlsFFkkm2N9I+SzFqn96frimmKEXMf5CuztyX2I9kfNz4zH+xOptps40V3XMkJpYA6joC9YJy8mETTDxArCPsMb2FFmUo9gGQ2dW3kxo60MWWp+0cLY7iI5c/2b76X6bzYppddMkxzIY7fZPXYCMrONtA39MreoFLt9YzGpMn5sbXEmS+1aj7f8B1tw1bFuNGGDcaoy2cI6d1QPGkz1+0ebRIm+sXVJoFuYUAV6Uvb+9UDCCppgoO8Xa0M26rseUjHdwii7CbVKNGLFKjVTllt/SfmxXYSBgjQYM5h7CnQi1aODJ60widJet+t2ANLAy/NkRbJ6D/6T5ghlAT0/8rLs+zDLe+CxgKcbTxMUJX+GofCcHhIe4mDslsPGbaJ8FsR2Fb/jTGmGr60kSKxvU218lsSWbnHWyuI0Wu//PX5yX7aR9cV7bQMPPoBRYa2uUPpyhtQqGTKPolo2e0zD1nLFVpyqlDgA2yNWn+2tVHG7GkCWk4W8tmEWBRMnQ9kkNfvSsjU5Mbt5pJwYciEn+i6KrWXWi4kD1IlJZNeKiQPoYiqSqzMs9FcHjn+Nt6tkfIAoR4gm+TKiVdn5GDiFnBfQ3+BDJfS5CnKTKw57RRYA0IOqzkjOksrQh2Zb9YA76kp1/bZlfsWETklp3lJcqCb+r6sc+p5v8OIG7IgIdJfCNjomoejt6jHI1U4XozgRUPiMXS6nWPY/IqVHN9LZhf8xZwfi7MrZdbzqG7paPMiPl9r0hvRMvYuX0MgrBGoNflzwYVzhvyh7G9YTSkLuOFXihUUV94bL52XQnap2BFt2AyWysSOQsllLt11DDm3kdt+QxZu37cV31UxRK8OBKpkEyZ/leRpOYDBv2VTDHVm1WiBumuBLW58vwMcpGkduDaR5Ui+gRG/+PxN8PKurE+HZpQDM+fYenc/Tk8nTpF2NYxTPNNU2sKoTtpVABGEmkR+go8J6ilR7rPOgDeSfjwfsjKo84H1YGtDDwnXV6YdGaOtoXZUS98CKR5w+Yxxa0KxzMQsANTwnXbO+ek3fdYOBQ+vpMACEG6dorB/1BePQc3zSK4xnL6IQmHmrHAqWlnximBa9FeJ6ci8o8alKtyBNYy8gqPfGFSERA5B8/pqdIIWLK8J0Eo66xMNBenSOoE2gCq4N8HKs1TxFQmnLB7WxFtTP5TLUSG0QJlvCKfCF9Z2XomMp2uVbm9jV/HyVexaoaNEgRduiWRh8b3Wd3hD9L7fXJ3PtkohPqaGl2gmP31aMpRQCtxY8OOVfy/fsGfaiPJq0owZO9F0lip1Pl5GovKDdZMnl/HaTHXOiBQJu59koT4kb9dTUND8pX+4QULTKHVEY/VIe5MiThQkLkksk+FBwqFxPytOzBRbNKPHop4IpXpWsorKcEpd9S8hrw/ssTcsOkh3Q0G/XUkQid0dNCw6VcBd7EJNG4IoCcGlFog+fSnyrhr7UdaoSlLvOlK8GbSJWrCDI1HgQRyLHUkp6a+1UOg5MQA3dF7plKCv3tTCrXS5gmCGY/ypN5u+4Z2o+RqjsDsDbToI3K3Z9Bl8Pp6mt2zAOktteQG5ghkFLpUDK5fw1MPjalbK5Ry/GtfblovBzU3Hq+z+LAuBZ8GGZ5XMWA9QKqqVa/+KOn2VvVj/RaR99pCTN2Hn+lu5DK3KQsbS6qwRdvTqIraA/1SrRtr6SntQ4q1xw8mlLuuYrMB9E01vmiV2jJrpmiXYo11DehPbUqMm6RrVhwRnaGC1QurhK9rCUJTTG362X+9eS3eothm9KIUGoXjTMzWqO6K8xt/W+lRIaUKavlD65rzG8dbDALkgLi0R8Wl8p32Jl81tjtBCAf00njZ0CXRqNTP2BPFppFZfiFuIHK7gaeKgrdV2ZRNYHLdRKNnRuxQVyUcDWmSXy7DYnSBagzXXeUTSX+WkSRc8Vn+yeDrqmEvA5Q8pBx5qQa+8mxIdcbbxiyYtze62XIU+kaTnfxXnyt5Dctu4N6EAzSvyPkBITD4yoJLhWD71X5TlPlhm1DJSpHkMTlx/hPlOQnLzhFENbrHL/6Fjlx89KnyYwDSegi+koa5b8sV4a+E1iIt0gqc3i6gDrLoMuTkNe3WjXJBabj4qabVMoFXQ9e2wtWvHSN0w36aZZeiC6Zg2tUkaueS+bi6AHPjYXgepQF8TMN08qZdcLuOHKnPZ4C0PQRS0FJ8A1AohDPQ89JhKIhbKCMjNNlrxXEDAjfyuiBBo2Tzeh0yvFyuYALV3m49xyrK+/VkQmA+9pwGzqJXGsThA1afGtD7Zy360Gw2fH2sxxu6VjtVqi6prtGCZvRjaNHGxV9F5d0XWVVSSyrtHUz4WmvhWT8wZV/VyoqoCWdfWtYTav8UbbbbOuxHrxJyrr509RVrV7eYCufn6ArsrFcbv2CMhWw1fCPAJ99NpyiNlqgNnICI3TbRpD34qjBo8cSQV+dTitnopBgMcPjlflqMgKHes3ql7dVG+AbebCfLNHEQBVRx77BWaQ4ASD5Zo1brgPWa9M5boT05/tBitLfTHLfKRIPVG1SSY1B7EqaPq7AOYbQray1dtrQiKTrYr+0YtyKLca2ApIlHs/4xSD4bZ7LKXkCrH59fIvydQDw9FDouVb1BWnvY1vL5T5jLb27k2jpy/LpAqI+9o1dvnUAEYNhPse+I62nLIX99PJiAqhsX4QusrRuTXYVLvumTXQ7U8p9bSGXbzNpnKdjcqu8rmnnmA0HfWrrcep1d1Ykb1NFTmvq0gYP6gi3c0VMSxmyiS2nwNXfzxu6aU6qbzXI7m0YfoU92c57ochXGtfs+GnWp/X0iSkQCtxXBZslgr7h77c8zlLM81lS30ZrqtdeFkW3pAT9oDLWlkTM+2iaFKgMYBRubCWBap+jMlL/mzP57uuVr1dSL5o1LD5lQUvOJBIMcAV4WIZlCWO1euZqlfobX+JXuUaPfUSvOq1eZV8xkKu7xarvxivei8SfVCCvdvAB3+8awKsBLdEnEgPLYHl8FFXOxlbHCx6xC7S2iM8ru8t7Dqo8vROI9icRhyZzm2nNxqSeS2s5LGGMd7e0VVnzpV1BfNREzMwOsfTiB4Gtm+YSdfCNp82Mkis9hyFDom1Kmbmdr83tLeK724KX9fVeZljgVRJi5V2ZGOn6WxYcchLaQSN9iGD1BmHDFOzAXlHW3T+CYeFyjXmmPNNVJmLb2nxdbUWZGXniCfpde/Le5crYMbDLxYG5bEJwFSzWM506T4vGIlEZcVNA2syf19Lv3HzdgVaBFe6wyaey1ms6zbBKdvffRLLF+tUi1bs3TUBqtMlfUBY6/bARoDfj0mw+v7LrILHev7lJiEGftUq6rYsFbqs3uHPz/je88cCNJ/opJrE/DjDdfonpkSEXo931m3qheXXIXUB3iZJ/kMSkFa7d51kOcw2p3HWEwEocSMj/Byf7oPnHC7y89P9PCUk82EI6KbLuHtNUnJ+ihvcLbrD6mx3mkQBvuZxFQPl3fNTKqfzU7qwZKHncLbrXxP/I9Rh14hzlSezWYSo+xRJJU9v+7jyJhOYBe+efx3lYznbjpOcZtrnH7xVjwrBAuYBQiGDc/S4BBQg/PL4Fr6B2K6ha/3Xf/6H0xv0rf/7f5zewcC6+K///N9Oz+kfdyDnfzm94+GlFSfxryRNTlxnQ9kiW/zDhSVXmEKTFaQEJNhV8/C4ONhjcOWjfYGNNOZDJm4C5XlCt1eFVWrI2iMbu+dvxUDP7KLX6wm+jTZBDYZrHFpBFPq0Rewnfk7ybgY43nz3vHg5i7UqaprsCy1zXERGpvS1gEbLHTOwHvDwLkli8boGJ5EveOwBO13lTZGWnZP5Ar0WpEPSFAQG/iGeOyk9WfY4wl/e/fhDj86jW0iwx4+H6/RY3e220mUANUQpnhex1ObWMz2Nwdgt39XALmNDWxR1EWpUqrTboJcPWQL2c7+LWyN3T6zdlyz6VtyvA5MHjBnCdNny6D6Ads/6Fv3XfZaOO7rYowg03rjbsXalpxCQ4vCXV/94c/Dh+Y8fhrPk77O9Zy/3D974z395+3J06P40239z8/blm+GzX799OfhzcvB6f/b819s3z87OClL0NQakxBsqZmgvH2Dus//xzfPy/wxfunIBQO53PRf+cZGwAz+GMIXZLY/cQsrF/S6eNkByAAq5tGnST4CyXMDBVHrUAFJhjrQLzYOSuoTfd3W0nCot58Tqm2n1KS3tjBMSxGT13iNaKSGe8oYkpAujNyR2sWtyR85h/9jpD4bO8LCPed4KSzRl8egrZLNp325xVzXFgB7vwHUGh4Oj4bHjHI2OOQS9wrqOpnjOGetwcXzIThEc0Hdm3YMB+xy49PNwBDmH+H/6eQQ/R/hiLvs8PgJgB5/2Y8/xOvh9ADy4Lnt918WEEb4fOWQJfUjoOweQcMzeuR3geQYsoX/AIJw+nmigf7FCDhH9GJ8bdBya4OK5h5FDUzFhNESWsaQjinGAP/sHxTcSOx4U4FjiIVb6kL6kewDUBkjRdS8v0QCVHf8gohEz77rAObMsoXP+WOCuwKHmhY1mFwM7jWAXKgi9hIS2OTC50mjL57/QMkWCMNRNZcDvDYW4lUKGaiHDjYVcbq7rv8cW9OMqHMtcX67lrpV3o/ATBs3KQF0Z1TXHpGkI/6f1ku45OrFevPmrJVyEr2f52FwKYwCHbuqqQpfOIhIn6GeQXSsM0INKr4qefjgNnIlzdHwwOhgM+oeH3sHkcEAGI3I89b2+P+Xswd9I75y99QN+wBynIFcKtyfg+LR6in92cu1lrXPmqfRMnhvFOaFOHgnwxoQ2HYQjjEN+6dE/MJBB7Wjpv43zaPHit3EiDVlGWZi0CuCRt8gwk/qiBsPQaHxp9Ef/P/VbG+VRb9C/sZtLxde6uHB6R4P+gTtwLfqkwlH/YHR0iA/I9vr9kTs64ul9Z9QfHh7Q38fuEQxEo/KZWiAy6vcdd2hR4NHhcDAYHjLEYX84cAaUIBvrDmi6GBkvoZNn80FquVxJ7RqZfFqT94+O3MA99P3jo+PBgPhHpO9Mpv0+OZhOXXciNfnGuVRhfC0Y5Bjb9N2rjnVLvI9XNOEnvHDYpFzK8ydPBdiBzu8CeptM6b1OB/3+ANTkj5xgEIyIR6b+wPMnvjcaHEwJdca27wBl4I2iuxzzSUjipzDvME5DxEwBq8+BOLg2N9jtFRK6wuzdCuqLKKHBUfHd8zGBFkPveh6XOSkBo/DJ38P8uqWgF0SnqTfjO6+1iNNL/vmKQ2AdBLQStRCEMd9waKPQl3Zog70iJXZVF5Thk8e6nt99B8QFNn0onr0/lixTn7ykxxVrZPgl2v6utWdp6PwwsCyWglpvGqaZKJvWDBDK3HJatlY1YRTyplnY/wO3jl6U</script> <treescope-run-here><script type=\"application/octet-stream\"> const root = ( Array.from(document.getElementsByClassName( \"treescope_out_3f82b7b5d2eb4971a74d921d6273d53c\")) .filter((elt) => !elt.dataset['step1']) )[0]; root.dataset['step1'] = 1; root.defns.insertContent( this.parentNode.querySelector('script[type=\"application/octet-stream\"]'), true ); this.parentNode.remove(); </script></treescope-run-here> </div>"
+      ],
+      "text/plain": [
+       "<IPython.core.display.HTML object>"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    }
+   ],
+   "source": [
+    "class Count(nnx.Variable): pass  # custom Variable types\n",
+    "\n",
+    "class Linear(nnx.Pytree):\n",
+    "  def __init__(self, din: int, dout: int, *, rngs: nnx.Rngs):\n",
+    "    self.din, self.dout = din, dout                                # static attributes\n",
+    "    self.w = nnx.Param(rngs.uniform((din, dout)))  # data attribute\n",
+    "    self.count = Count(jnp.array(0))                            # data attribute\n",
+    "\n",
+    "  def __call__(self, x: jax.Array):\n",
+    "    self.count[...] += 1  # inplace state updates\n",
+    "    return x @ self.w     # Variable are Array-like\n",
+    "\n",
+    "model = Linear(2, 5, rngs=nnx.Rngs(0))\n",
+    "\n",
+    "nnx.display(model)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "> **Note:** Most user code uses `nnx.Module`, which is a subclass of `nnx.Pytree` with additional features such as sopport for metric reporting.\n",
+    "\n",
+    "As we can see above, Variables are array-like; they support arithmetic operators, indexing, and can be used directly in JAX expressions. You can update their value in-place using `variable[...] = new_value`. Since NNX Pytrees are standard JAX pytrees, you can use `jax.tree.*` functions directly on them:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 3,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "y.shape = (3, 5), model.count[...] = Array(1, dtype=int32, weak_type=True)\n",
+      "\n",
+      "model.w sum:   4.1854\n",
+      "doubled.w sum: 8.3709\n",
+      "\n",
+      "Pytree leaves:\n",
+      ".count.value: Array(1, dtype=int32, weak_type=True)\n",
+      ".w.value: Array([[0.8423141 , 0.18237865, 0.2271781 , 0.12072563, 0.19181347],\n",
+      "       [0.722015  , 0.7654456 , 0.15254045, 0.9517063 , 0.02931046]],      dtype=float32)\n"
+     ]
+    }
+   ],
+   "source": [
+    "x = jnp.ones((3, 2))\n",
+    "y = model(x)\n",
+    "print(f'{y.shape = }, {model.count[...] = }')\n",
+    "\n",
+    "# jax.tree.map works directly on NNX Pytrees\n",
+    "doubled_model = jax.tree.map(lambda x: x * 2, model)\n",
+    "print(f'\\nmodel.w sum:   {model.w.sum():.4f}')\n",
+    "print(f'doubled.w sum: {doubled_model.w.sum():.4f}')\n",
+    "\n",
+    "# jax.tree.leaves_with_path shows the full tree structure\n",
+    "print('\\nPytree leaves:')\n",
+    "for path, value in jax.tree.leaves_with_path(model):\n",
+    "  print(f'{jax.tree_util.keystr(path)}: {value!r}')"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Here `jax.tree.map` was first used create a new model with each leaf Array doubled, and then `jax.tree.flatten_with_path` was used to show how JAX sees the tree structure. Notice that because Variables are also JAX pytrees containing a single element (their inner value) we see `value` as part of the leaf path."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Rngs\n",
+    "`nnx.Rngs` simplify managing [JAX PRNG state](https://jax.readthedocs.io/en/latest/random-numbers.html). It is itself an `nnx.Pytree` that stores a seed `key` and an incrementing `counter` in `Variable`s internally. By calling it, `Rngs` can produce new PRNG keys:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 4,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "key1 = Array((), dtype=key<fry>) overlaying:\n",
+      "[1797259609 2579123966]\n",
+      "key2 = Array((), dtype=key<fry>) overlaying:\n",
+      "[ 928981903 3453687069]\n",
+      "arr = Array([[ 1.2956359 ,  1.3550105 , -0.40960556],\n",
+      "       [-0.77188545,  0.38094172,  0.01888919]], dtype=float32)\n",
+      "\u001b[38;2;79;201;177mRngs\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # RngState: 2 (12 B)\u001b[0m\n",
+      "  \u001b[38;2;156;220;254mdefault\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mRngStream\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # RngState: 2 (12 B)\u001b[0m\n",
+      "    \u001b[38;2;156;220;254mtag\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;207;144;120m'default'\u001b[0m,\n",
+      "    \u001b[38;2;156;220;254mkey\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mRngKey\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # 1 (8 B)\u001b[0m\n",
+      "      \u001b[38;2;156;220;254mvalue\u001b[0m\u001b[38;2;212;212;212m=\u001b[0mArray((), dtype=key<fry>) overlaying:\n",
+      "      [0 0],\n",
+      "      \u001b[38;2;156;220;254mtag\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;207;144;120m'default'\u001b[0m\n",
+      "    \u001b[38;2;255;213;3m)\u001b[0m,\n",
+      "    \u001b[38;2;156;220;254mcount\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mRngCount\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # 1 (4 B)\u001b[0m\n",
+      "      \u001b[38;2;156;220;254mvalue\u001b[0m\u001b[38;2;212;212;212m=\u001b[0mArray(3, dtype=uint32),\n",
+      "      \u001b[38;2;156;220;254mtag\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;207;144;120m'default'\u001b[0m\n",
+      "    \u001b[38;2;255;213;3m)\u001b[0m\n",
+      "  \u001b[38;2;255;213;3m)\u001b[0m\n",
+      "\u001b[38;2;255;213;3m)\u001b[0m\n"
+     ]
+    }
+   ],
+   "source": [
+    "rngs = nnx.Rngs(0)  # seeded with 0\n",
+    "\n",
+    "key1 = rngs()       # get a raw key\n",
+    "key2 = rngs()       # different key (counter incremented)\n",
+    "arr = rngs.normal((2, 3))  # draw samples directly\n",
+    "\n",
+    "print(f'{key1 = }')\n",
+    "print(f'{key2 = }')\n",
+    "print(f'{arr = }')\n",
+    "print(rngs)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "As we've seen so far, `Rngs` conveniently exposes every `jax.random.*` distribution as a method (e.g. `rngs.uniform(...)`, `rngs.normal(...)`) without requiring the `key` argument and returning different random values every time they are called, this highly simplifies the user experience. In general `Rngs` can hold multiple keys and counters in structures called `RngStream`s, above we see that the `default` stream is being used. For more information check out the [Randomness guide](https://flax.readthedocs.io/en/latest/guides/randomness.html)."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Nested Modules\n",
+    "\n",
+    "Pytree subclasses compose naturally, you can assign one as an attribute of another to build nested models. The example below builds a simple `MLP` from two `Linear` layers:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 5,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "y.shape = (3, 5)\n"
+     ]
+    },
+    {
+     "data": {
+      "text/html": [
+       "<script> (()=>{ if (customElements.get('treescope-container') === undefined) { class TreescopeContainer extends HTMLElement { constructor() { super(); this.attachShadow({mode: \"open\"}); this.defns = {}; this.state = {}; } } customElements.define(\"treescope-container\", TreescopeContainer); } if (customElements.get('treescope-run-here') === undefined) { class RunHere extends HTMLElement { constructor() { super() } connectedCallback() { const run = child => { const fn = new Function(child.textContent); child.textContent = \"\"; fn.call(this); this.remove(); }; const child = this.querySelector(\"script\"); if (child) { run(child); } else { new MutationObserver(()=>{ run(this.querySelector(\"script\")); }).observe(this, {childList: true}); } } } customElements.define(\"treescope-run-here\", RunHere); } })(); </script> <treescope-container class=\"treescope_out_499803137f5041bf92c9808947b11c6d\" style=\"display:block\"></treescope-container> <treescope-run-here><script type=\"application/octet-stream\"> const root = ( Array.from(document.getElementsByClassName( \"treescope_out_499803137f5041bf92c9808947b11c6d\")) .filter((elt) => !elt.dataset.setup) )[0]; root.dataset.setup = 1; const msg = document.createElement(\"span\"); msg.style = \"color: #cccccc; font-family: monospace;\"; msg.textContent = \"(Loading...)\"; root.state.loadingMsg = msg; root.shadowRoot.appendChild(msg); root.state.chain = new Promise((resolve, reject) => { const observer = new IntersectionObserver((entries) => { for (const entry of entries) { if (entry.isIntersecting) { resolve(); observer.disconnect(); return; } } }, {rootMargin: \"1000px\"}); window.setTimeout(() => { observer.observe(root); }, 0); }); root.state.deferring = false; const _insertNode = (node) => { for (let oldScript of node.querySelectorAll(\"script\")) { let newScript = document.createElement(\"script\"); newScript.type = oldScript.type; newScript.textContent = oldScript.textContent; oldScript.parentNode.replaceChild(newScript, oldScript); } if (root.state.loadingMsg) { root.state.loadingMsg.remove(); root.state.loadingMsg = null; } root.shadowRoot.appendChild(node); }; root.defns.insertContent = ((contentNode, compressed) => { if (compressed) { root.state.deferring = true; } if (root.state.deferring) { root.state.chain = (async () => { await root.state.chain; if (compressed) { const encoded = contentNode.textContent; const blob = new Blob([ Uint8Array.from(atob(encoded), (m) => m.codePointAt(0)) ]); const reader = blob.stream().pipeThrough( new DecompressionStream(\"deflate\") ).pipeThrough( new TextDecoderStream(\"utf-8\") ).getReader(); const parts = []; while (true) { const step = await reader.read(); if (step.done) { break; } parts.push(step.value); } const tpl = document.createElement('template'); tpl.innerHTML = parts.join(\"\"); _insertNode(tpl.content); } else { _insertNode(contentNode.content); } })(); } else { _insertNode(contentNode.content); } }); </script></treescope-run-here><div style=\"display:none\"> <script type=\"application/octet-stream\" >eNrtGotS20jyVybeusU+sJBkWbYhUCc7fpFAAiYh4XaLG0kjeYIsCWlsY7by79cjyW/ZkA0EyAJVMfT09HP6GV6HbOSQfYEFhISG55OLwPMY+gv5XkgZ9dwdFBAHMzogu8jyXJa3cI86ox3U81wv9LEB8GGXMpKPftlBfgAQh4YsH5HOs5EPUNdzAaxj49IOvL5r5g3P8YKd+OouSn7THUAAetRk3R1kUQZoLiMu20U96uYTuCSK/wJa3nU+pDfUteGeF5gkyANoF/nYNAGYd4jFdpBsdLk0Lsl3CbW7AJGEIufnMkxBuQn95If8gIZUpw5loCLuM2+Cm6cuC6gbUoOzJfFpote319uxHV9P7JgP+i7wDAAWGgH1GeKG2NvAvu9QA3PTbnsGI9xMAcG9jf1sNre3D5YHfiFDJrHcEO0h1qWhYBN2Am458kySzQldL2RCdA6qEYYufOJylTWDU+WX/vtn2kkLu6ZD4NjtO85uzEEAMTue5wI0O/SCyxyalcE7AxA/mgMzanCgTwLLC3rYNYjgesNsLnoIwCC7dILy8aXXqCDngA61UHZBasEhrs26aG8PiRxlregBYf3ABbsj4oRkKli373LJFkmHXWoxLl+EwH/4Bt8rOGTh+bmmNxQCctUnIdNc2ovc1Qhwj2Rjm+Q4jd0lRn4/7MZm3E3RccxiL1ZjjZZ3l4FLETuSebbtxOF7EYUYvFaf0+IQ4rAtRAbwwBNPcumi34VLMuJGzwQZLlCCLBgODsN3EMUJ3WxmQvOiB88wM2b+LQf2hOcfvfH919tpAWDSAYoI7mXm80wGMayDpuR6LyNmIHQDtoziuSAiGMOFo3XBkG6BLL8z1j0DwRjnuyjhXGBdD8ggej9R/vlNLctYFEGrBMHwej24OIOBoy+u/AIK3nE9lt3pegMS5FLwE3S339NJMENQrJSlosoRQAsSBMS88CENkq7nmHOIuMS/kywcqbGDKMOQTfhlC9CxDuq7YJcV+RtknkO7iC0G2CYNgelonKcXEdE+crBOnJ0dnUBkkxmpjOhrN5VfnILzEs/BSe4G2054UTdKzLrj8aS/kmdk0WXOJg4uQ4JteC3u8u3IGQugLg6z+xHN/VQ7xA40usS4JGYuh/6dm8rAr6ZfGuPPSRjVkh208Ydc1I2NxxRv/tJKIdWfICT3I2fcD0LuQN+DikqCFL40vD+2UShEjPJRDghXvfH74TpVj5FrtsxFoOGFRYOQXXjuBX/+KaG1LpQEucijKdVV6IfFjz2+KCLXqocDG3qgWIwooL/9IDfIh/5I7zMGzUdaApoepz3aDMosYIEhoQNNR/6DSIqZWWhgNw4xvAqKHdQZ9XTPCdH7PuP6mqgW34RPfwSBkR8S/RKa0Tjz9qC+dKO2E7sMrlMcEnPSwv5GRP69u/zM49tR6ygKFdJb1DKOjxQt0tPd9KYwxOGFAXUADDu5jy02Vz3GeXodz4U78yxnTY8GOMjm8yZmOI9dcGzUnORmwZwJ77gC7I5fc0QWSSEiYDFop/Nen32fKhMJwDGUmK/mJYlYole053sBw+4SbT3wLol7wSHTZHS7dWeuzdhz7OZvAu9fQDDzwoDu1wyIm4g6P18AzXnEe8quM6GTFNK5UDWwY2RhCIIOXPKvo6ZNCBnm9yfyPpgkyVgWS2J6DHTnUswa76qPHRd62gsYGy16DUTmwqQchQk08Jj3RUMcuBB4F+PEPvaFZWFDKqQg+tAB/zWZCINkAOTZKzFSAsqLQpRWp/PpTjQ04iBvB9ik4LYskgpFk9hbyIMnbRMkgniq0d2Knzi0rjxhRCCUmHlJlqXMej9pGy0l6LE+34RhF54ub3PTciwveZCIU3Hi5mwGC7iuIhRTAG842IdceHs/+f3FYjWHqaAxErmGpGGuxLkPOdJYzJliOn+lmWJ+wBHmByu0hsKiqu7cqJeOeBdmK+nc43aDD5zolRYEeCRYgdeDIdbo88FJ4AEfCgPswKSbzeWE0IMRN0oDfFTln0JcsvmYeseindmAoMhNFgNhlxDGtwdkiGqdTodr0+EwvguIDmHSjqauzsg1sv/7T9IoGGSckL6/aZgd01y+DXES2DBZRCl80AwDYwf1AyfLK9gOP98eepYl7+pQI1VlyxQrzUNbq2rRV/tY07zop+rJEP5tNTStrq37qvY0zb703prterU2/KJpp19qB9phu1rTGvZ1u/Wuy8LqISV2ofHms/yurX4ZdPw+/XBYPJUOPrdPPh0Ozg5v2IdRo1HbPLMvT2n1jdilb477B3Wz+VVs6dvWoG36V2/V7tUZpcf9Q7fZbVkfmfZRrR4FitZou5d11fjY77ubJ8UrI7wcDqyGs311bde9sq0fDJtlqaVtu9pJ8V0QHEgnm/aNeGKK2oEl2Uel2rD5VbZFb9Q/KZV6dUkdtj5X3tu2T04vRwpp6zdFQw/eNxnW7OP20fANDkfhcb/d/nxWbwy1D8d++4v5cXt70y6dlj4XmGi9/XClDYpA8512VNIOh1rPvjnpbPbPO6T++Vq2VOPmSDlpjYr9qvb2pvrVb/gF2jqu1cXz/gelU3Kt6rt6q3HY0+hmeVCXu67ULW3qn4afvw5bweBN82PN/WrV6zbbfG+cO06pWKkdDKvlbkU5PGx2Cs1zze61i1+rxxV22iStSr1abTcLb2zlZPuLMdK1Jvj009tt7biJNXJYc7TWTf29fc5stfrBfv++/aZ6SY+LpFH9XKs2DCr63cDzXXgb/nn9jXQjXXasmsW6o7duy8SNsGWJR71m/UitmtrVp08+ZmHnvGeamFZk66aifKRfr1S/F6jvvS+1Dg2avcFBs9A56xQaddmoHlunmy3H85tKIxwWsX2lluk56Rw5/plbbbWJeRiQ/tlVs9aTzhrBZadzXZTVs7NwqIFEORRtAll2I3rWG7w0/g/+mUQ/Nj0f+oJpSEb7S0EQ1mBsxTH7J9BavxHqRgu1qHWLu0qgDc/DNVA2bu7m150QgqceD19AS5o/DgshPXASvJvlLSAeYsqQiwfUxswLBKDs6x4OTGEYUEZOYfDLTmmBsgmt6U4NGpJsZqbV5ds04HJKewR64ux43bp0LyA96FuXrn7bQrIoilHbAckXOpBsNLSl853pZzNT4fi4Os5gfAGZQb+hBqYOJDbmIY78Ksps0Gi40LNBNqZgM4JN3o5vztou2QzeshPkrf14KTi/91lskjL7r+MK/Zq6fj+pNJmoJuvedSaVSFK+4TAu3SBEdHme73ylzez/7jAuNmCsx5s7XOhg4TShEH8cvvuQfb2dKLBEdNxJLNCc2yxm9sEVNeDO/zsDZcuomttCH3CAe9DLSgBRlBh2CnOYw2EKwIoqwOZFmWWxMW7nNubBHHThDJx5cGZpxsmsO8/sQ7+9l6JRvPzM7MuJRFvLFpn0eKD2Sl+km21jOrRtIM+t8QDZ2/jODBHti3MbaDJR7mUE0CaDolK+l5mZNaEb4Ed8QbA4CsNRFAuQa7vwcyLnwtNY7Z1le/aouc6gkvrMLAr6rDQpnP0Um0KqXWfT4jMzKaiz0qRw9jNMGs/M0t7q7P68k/m7SL/UfP5gfk1susq1yfHf9+4P1yQJqs1sTSpASZLkuZJUKAAI4C8V6X4fxbrKNIPyFLLpc6tQE/OtSauzOD/DxsMHSqw/M6FaDr4WXPdaGOCAckkcqgvzNojyyKMkWWF4m6uHj5Fopxn10dJntJ7bu4PfoU/NTP6QwZJVySzKsqpWKkpZMiuGXlRE3SpVCqqCy/oC07Q/gEjeXbqmX+EtRSvFtLSxMdlrR4hjFMvxMCvIWXkLSWrud3v6qG9x19yWNFXdgiIRsVDCeqkgKapBypJiWQVcMOUSVkoVK7P/0PGbNmg+KaveHgtb3xsv6/LPwyeMeHF9a9qI0e4neSwmCMgQn2gIiZbeRBRRl5oQvYi6aLrV5+v+v/XCfzFD3v1jxaNf54pVJXL2r80y+4Ig3MGtyzGUW1+el/CfWaf1kLX37j2WwYeaX6DPmlc5GtUep6WKDHqbayOkx2itkuH1SfRVc70EFlWrLJsEY2iZjIKOy0qlSMoiscQiLlvyY7RO1OUlPq2632M9/zkP8m7VZgb1QSvOsy81z+8BPHBGeukvnlp/8WAL1O9dj8sv6/F796683rvyE1qPl0WULcji7Hq8LHGQ8oTX489zeyvfvh+Xn8p+vPhMDXzrelx+WY//Iutx+bYRXX6c9fg0oz639biCsarjok5UVTEURYciYKmWUirqBatklh5zPS6pW6h4v+txSS+SSrlkFCqliiIqRMdExCVRJ0ZRr6i6/g9Yj99m1V9rPS7fbasrv6zHn4whX8bXp9ppPWTtfVmPP9J6XL7LMkp+WY8v9RKGpMqqJBaKpXJRUZRCuVJRzJKpmnKlWFbK5Zf1+A89yLtVm5f1+K+3Hv85GenF6U/L6Q+2Pv2nO3qCadLB/v8BK0kfrQ==</script> <treescope-run-here><script type=\"application/octet-stream\"> const root = ( Array.from(document.getElementsByClassName( \"treescope_out_499803137f5041bf92c9808947b11c6d\")) .filter((elt) => !elt.dataset['step0']) )[0]; root.dataset['step0'] = 1; root.defns.insertContent( this.parentNode.querySelector('script[type=\"application/octet-stream\"]'), true ); this.parentNode.remove(); </script></treescope-run-here> </div>"
+      ],
+      "text/plain": [
+       "<IPython.core.display.HTML object>"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    },
+    {
+     "data": {
+      "text/html": [
+       "<div style=\"display:none\"> <script type=\"application/octet-stream\" >eNrtfet62ziy4P88BcfT3ZLalsyrSNmx53PspJN0J1HHSU9nfPy5KZGSaUukQlK2bI//73mP3QfYV9hHOU+yVQBIAiApyU56Zvd0OxdLQFWhUFUACoXbUy+4UpL0ZuLvbXhBMpu4NztKGIX+hhJ4exujKD7z/JEfx753Zpiarxq2O7ANzewOfUczRyPDNTzddk27N9rYf5rM3BD+R3r7HTeO3Zur4PZsGIWpG4R+rNwp1+dB6rcBbuhjQfHUnewq90oVcCcIRxGgjCClPXKnwQR4m0ZhRLB3lWE0ieId5a8u+dlVpm48DsL2IErTaLqjqB3d8qe7Yomz2F9eXBDO5ulJejMDgcRuOPY3ToGFKz9Og6E7abuTYBwCF4HnTYDSKJikPvAwBmoJ5PtNraVEUFSQ3jTVjtV6cGE759EVEVSZ9MPohfPpwI+BYBilzZ1RNJwnLSA7iGLPj9ux6wXzZEcxZosvI0k/E6aRfKYTm/zssuJ2FG22UJJoEnhF1pJSOwlA+nEi28sy7REW0mAGOIIh7yqzKAnSIAK1uQPgYZ5C2sAdXo7jaB56bcYyKaiK4cEEYIGK63lBOKZ2NTxHskEIGmr7V36YJllh14GXnu+A9tI2MgdZuwpyNppE1zvKVZAEAzSccrVu20Ho+QsoWVXV5bUcRIs1axkt2sm562HRKvmD1SIV2mIJOiSwqldXKOert4St4SQYXnpu6j5EY5PIRYmeTf0kccc+Zz1Zi75/uk37kqdp7PvJMJr57Xgets/9GNKSYRzMUoXYZsOdzYAHFyWwHQ1TP20ngONOG/tP8AeKTVIl40LZU5rNlrK3r9w9URT4O5qHQ0RVPD/x4wBa+a3/EaThNLHRAICixH46j0OFpB4gnc4ojqZNN40GALSlNKeE4LQzjDy/j6I8SJtqq7UL2PdP6ot5AWJIDb0oiLI6uEn9BPh8VHkZkRHSRiqhf62wggitJiHfGcxH0LczFFZBirOK61fhv4RnUsyDOKYsT/xUOURjmrqz9z88OwLL3JVrM/bTQzDGIJxH84QAN6/cydzfomYImIiW1RApDtzEPyOtYUuJRqPETykfwUihqMrTPUXNMBQOHqqj7rJUilmk3Cv+JPE5Ivt7ilZDhOesM/HDcXqutBW9RFrriMQzYlTEwzTJKdIiv1ea1aS11m4VH2/c9LwDcgeZ5cRaJS6Kcr5VNMYPp+lYqtBJUcTpiXqKTGnAAiXXUjYZeaUOSdlUNIbIa4cWNl5WmPbYwrTqwgbLCtMfW5guF8bs/yTeUsZbyuC0utHehOA6DQ/iYRKE5+99oN5k5V36N6TP/4WZ/SSYvXHBtmP3+k0Q0t/4nZH4wZ1lZplTT1IXxrNj9E88VkQTMFJ3XlgwWvZfguRFEMLA0CRZ//wnNSEYqpqLlrKNCMpTRfPbZoGXV3CRWZZkzTkAoZWAZ4bEvifEvs9h8IcATKJxs1zqJsP+HKegFPZtFl03FxRgS9Fbrdy27zkrztu+IEdlT+gDMJ/KU8qQxI8WQ+VfW1kZnpKt4kyGzGstZGS9KNFyBjV1F81M74yh1m5NTZ/mEDmX/6ZftNmBtrDNKHtPJM37i1kzNwFRBtAMC/MG28nBsqrlqs/LAFFlJW3ThiyKZVsSHB08QLDQ1wJuVZPJmx62jl3OdDIsyXRyYtBiNFU0gbx7xaY+87GXRWuHcXdZY91mNDNarGVlRCpHky/WVmH0mSSLr1WmKhNCuXp+GE2DEHyMOLfhIGxyJlBVbanrYyIgLHC93dYKKllDQXRBbQJTku5EhisVyIS/lto4csUQWxoF0ugYHenjNAaPm471ou+WDyLZ0CUMMb/F40Hzm7v4Xvnmboz/De5bv1UON+jfx24CbtX4cSVyEDgdCWFWcwMQHV3Tu9A+Y+iiO7Zm6fB5jJ9VW8fPg6KTKtD2FU13CtmzyjTIBKhRadIZCJnENASBShWF+fmk76YwYQrBBwJ9wN+bLZgmkqR8oAQlN9FMA+Lwwa+nGQhzsiBtc7MleWhxdA3wDPAkOM0MJCd3QcldADmAzUld8KTY4BNdn1yc8qlQSLroIP/v/WHaRO/iAniHX8GWom1xPl9hkfcl06KMesE4SInz3I+DqRujqk4IbOOvI/LT2IKP2si2Byb5OBrZI9UnH/Whq+pD8tHr6rbukI89s2sPPPLRGVpdc9DYYgR9w7aHOskZDAeeTj9q9sAfjhoAQ8Qk83XsQ4oncmaP8A/Bdv2h7TuMs8HAZjw43shxWWrP6XXJx6E1UD2LfjR7w56ZczayB12PsuMNvIFD2e/5nutbOWdPcu6G/mRyDLMoYMnepRnSpAVmJqNgXJqzeNDjvAv9Q8DPejhie6BkMm3ZUtgUJkigZwu8Yi5DCW7lHXpmEMw5I9CcFTIDIU0YuGxEl5PhedOyvsWgQaux+6TCkKAoaIg24YZ+wL+t3eU0bVWiWWpYjC46wTlt+uUkt9MTdUsp/p5uCRkaSdXKGV8F47RVmseJQu9ghAKGAajyMJ9wNuQmP2Ruv+C9lEhlUMJoEyRv3bd08tjiG3pJ4nzH91D1VZDDQUG3LCIP+N3iKD9KiSBijROxdsqPv7VqyRWjlVS5HKuurNOW5IIXU3PQ4SvQA0xkbgRBUw2iqkAuFYEFmI9vKSXdlUVaNUx/LXUtHZm/XHNUxNrD1fO4rMqylmuu/SjVqX8I1RUSrVJCXfNZ3h6XN1VtRaOTVcQGLg8nvmwMY13erujvZHD7GAWT/J7HttOHqvuhCn+0yh+t9KUNbFWmxrU/7UGY9ZmnvNdZtN5cnU8V9cHqVP946lSXyV19tDofTLZCnbzqCrclU3BL1G0+x3+471FZYImEkIc/oglUWFPGKWdSguruH20v0ixrlSOpNGYuTBZSFh1ulMJvX+RRiq0qyz4hfe0p73YyEOBnDmzA0Op7f3qfX9/7lAfCmrhJlYzysM0WidtscYGbh6tgbeMkc+9BVGuXOIntu3GaPLs5QtB8Yk7kwk+4UH72aTkF1KZvKUZ1DgjWWgnRZRAm/jbAgFZCWgySYJiPwTDwt/VlmPC7i/ZSzD75GHMQXuE8HgQ6ckFLfGOlXvC3iqb8RYpHFt5Tjp3Gc3+FFYb+2E2DKz9fQnxarHBmMFN3DO723BOWIGSfjYvX4KpvjtPB/ph0xa1OMpsEabPRkFw9ipQtVj4tGRbLqXIaEPRshrBQpox3IhA+5ft4lPIsJjskzmJ/5rtpchaNcLV6PpkI43hF4E8gu6tsbgbymMdaeJICN1tKEng+44FxSVnmAoIlGQLgW7JNh0kHYFsicC450nWXKyPzVO5WKoJrVGQSW8p6oqoZr5eVy4KNDymVgErFVvoHpC8seQfFCMKUU4wiJW3xn2s9BMkZytpTa7nXUh5FS65S3eDH9esnUvVOqn2/YpJXmVHhEJ7WVLdCwXz9Kzse3i3ig10U+E9P42t6GpV7RdYWw/rirVlKQTeCLsUdhN6r0AuGftKUI9kBTccPCdgJQZU2IGUd+gnrEkgnnK0lAZICPUEVdmZZkHPSQD+mcUo8GRh1/NidNHhjI2V0ZvPkPEMgjDYqY09lkrLHnrGeb5ph1TxhqO4iSBqnp+LAlwHvKQwquQxmZ6QfakhLPRy7v31zVwF+vyMm+6EHib9Vz8ZZwU8fWi7Fq6K6CkdpV5WFO5NwvWo53+vogypPXjQrLYiU2SOID6hRozl1k0vfU6J52mo8is2zSRRdzmclbrP1G+W775S/MNxgHEYxThBJb7lEO/V8latDTTWZD5IUfDTSdnMTpLydkbXqxqk0Xcw4FVHrZo4lDufhZRhdhwJ7NV4Dh8cXVjcurSN7bIJVokfvrrrZdhClus3ur246Oc3HtICyXT1IbbRIifV1tbZSZ8tbSI2+7usmInxxT/+235AmFdHE7/hxHMXNxkfKC9/3N9g4Urmzi+0CoAVcREGYzT2EDaYHoOTjmT8srdKegfPn3nwM02DyC93w3fR8jP2R7clbikvAMtlx4xfZHh7AqHPzbpD48RXZvMP2wfpx4hO8LKvZBB83Dvwk38ic6Yuln6innYBDfI/FgwGq5dGHbcV+48aXuO1+T+H47Xye+/HNMfizwzSKDyaTZkPeus2LnlauyS9LZFMhf4INRipMNCEA6cT+NLrym60qUy5LqOMFCVQiRN9DVuaWcnef7xWGaiTpQQgTB2TwRexOfW4TeA3xiH7g9Ze5MtU7uwfzYOIdsH3mL4LxPJaUPyTRkqzWq0xFZPBsXeoii7xpPpC/zHkaRTSIjYEe/MbvdiW76p+5id81CyAusQR7RENFAihJ4yHJuPUGhiaZspTB4+AJBAwaeGQbOoPnEnnYRdZ8OdAijYe8qYC8qYRMJjAGeBXgUgaPI0bRCpShtBOE83KDBfSEfT/GbSAFgpAsSXLuvyA+Nq4/vOIcYEGqdUC7T4p+Cpsx0Vex3YpXKYyWI3rMgBspCQDtU+RDD5yVlHdRSISDcCVZeiqhlmiGmZ7j3AT71ed0fJiHyXw2i+IU3CCPjPyt8nZ1Yndn6CyJhdJzIpJVtnih5ZKLJjjJZVvhMWE4j2PorcXExJ+RSYzKz2KkUFK+V7cw2U4WfLiRk1rSHjMsgI6brPwi9p/zg6xuZt/znf2EfyHxXq6nWOM0St3JYTRJpHpHk7/jQSlST+20yKDVAamWpnGSAEr1rtxHlwAA4BTAXOiMxTFxRy7kdMB7Ap+KfCQuVgZWcERFVrgmfN2Kz98DyU0iYigLd/qHwjGKvOaUWo4nGFwuuffRtSQ5sNyXfjA+T0uiu1lXdDcPEd3NF4juZrnoWOWKzytEV1Sdkx0itmpMkQ05Q4yrHWMP/I54t1jo3X29fKTOeg0hSRicpMqFnxA5heB9nHJngJ7IXA9dmLkl/NJd04uG8yk0vM4w9t3Ufz7x8VuzQUEb+TEq8rVDDiLi3u/CNDcVHY9HZLsPBfBzItkcnuijGp4T6iHBxXVSf5EKvDKqbBUVcpsN3SMsVnQSbMc1OZvyI9uYLcSJi5g9uJ84vKEKRdeIWwXJRs73xQZ4PuS8bOmqcn9eJQrjWfRe2T5/KLAEP+WOA3Cb+0u7w9nufnlneGl9me6JISdADgZJVYl5prgxIUd0F0sQSWaJ4WpF7VH5ltcySmpgG9rJlmMUCG65x83bsnCq1++ZA0k2wL/JSC453lT8VPG9haVuFSLcKoSypagdzWrtrlsdgSdM3MQDfNvFubyVwXC2XoaHhCpMJwgrVPgQO6OHj6b8QZ1VlVI71hoaWaLhNlaHaBg5pd9WBGGeVJzuAOf9lXyCkgvrkg4Y5pRSDyyct8hJbO7xMwS+I/5+eUe9K3PIphDFeMK5I2iBtG9SpT0VNwX8zXJ41o0VQ7+Cx6onPvTOMR5auuPWT5hXQGHz1Fpw4SM3QQB84jif5PI6LRtdFmjcE7xh1gEofyPrN8qO8pe/FNk19Cp2svMRBGlsecAO9yeldTvBRgUbrP5InSnvyg2H/mE0D1Pe9h7rVDGPKLMt8G82OeXmDg6mFn4OAcscIhG21qoFh00036JH4PnY3+McNVwuLq3DSl9F2ZSrIVZTkp3Ie3sl79A0Be5kWigzoNKsEVprOX7NwrP0dQD+1mX90vG91N1KtrOXi6NyP4JUWqksftxQnpR3bQj9wKLebB8ziSLznyUmi13U5l4xp6m111prXSy3VhTnQrTVxTJbFb4sVtjpYpmV1trootJGF/U2hkJCC62WUmsZcqV5rm0ugvu6kI1yscwon9SWUDdYi78quvDOJAj9v7NJiba7BDBJ4+jSr1nMr6N86M4QOPk8d2N/JfTriLhajSku8DZ+1yH2ydKBjVW2as8JXUjPj4q10SXbquj9VsHkud/zNqidKn/7G7qpuDdhCQbXr9ah1A2pVeOoVjuOan+Oo3+Oo0vG0f2vN44+WW/w1GoGT+3PwfMPPXjuf4XBk/zPB8OKG1X8VIhTNEP/Ovss7lfiMnBArwpytNhSdsZCXaStoPTAKBluOVkdGeMjd6VFWjkimEuCbk3o47IW3ndwU3fMgcyTuRuJSPCBBGCygQxv+dB2K07Y81g3NViiQHCfM15fg/jsI6bu8w25iPEX9yidAuQTsbvdF4YoLrrNYVXchsPHMpd7YdnBuWQ+SbmY91eLrGSLw5RIEf+HBrpWOEVhvIkhcUJv94HhGwHpXoyioLVjPrtvqnSXQiDGbwrpYz+/TydL7Xa54ssWl3IYwqyyuptnQb3Im0/miQhPbn/Kccg3Hk+uX/H124zebum4axR70jVePOI247u0Tb+4hwwJbFas+WQNBfNZ+6BI+8VikdhdVpg13//+/iYCLY8XIXytNJGbx5vIzVomstJflW2ER1hqJOUaPs5IBMQ/jpFk96zJ8dEtpTLMucXYKYKWp0sXKIsrMTGez90TVGzBwtBl6B3ChNOrXQb0gqtGS7xLMQgJVW5dTl5RoQU/nD6hLKDRFb9sga8gTS7wzFcjG9zFqI3dStB8JXINWLwa+AW5GZjM5rO7gWug09gNE9xs/i4OxjQAkEYz6ANGdfRh4OrH0cyP05tmI5i6Y78d+2j9QTjGK17InhsQktdorUGg3c4uIG3fRtEUCWhrIuJtY21yEXICngnBNGeLRiZuqg5R1L8N3cmweeXGTalc9Jq/ueOXie9ni+xUIE8p18R6pCh4Da3selpykABlBu5BIzMWir+2knhwQU7knmQUThWrjfLisyx0dsfvT1BWXutv7kod/z25wLFj+VPsZ6G+WYVr6H2IZhy5xVrkSrsYJpOf3IE/4Td3sFUlkt6Xjj6wsQXX36fQLggMCamRpfMJfhXWz0lKZkF4+dUxNiSU/oyLp/FQ9KbkZ+S2bYRTOxrUgLszuRILbZhefcR1RQ0iGry2TSPLsk2108XOtazEFloczRCbRCs7jnL/++8ZIvWRTlUv7zWrJMG3iOzK5kqRTXhzrG+EbNbCtT9ZX0xTlJCmqt+CvX1zF6D9EfOrxmP9CVfbVZzIrmsRoaxgDqOgh7STzyYRJKOKFYQ9wBvYUWZcj6BUGjqz8nxGWxqyxPy8hdHdRXzm/e++l+pfbFJCrxlHKZDHbrPdUz1/3KikXdEvM4uKsduvLCYWxo+1La7KUtvK4y3/wRZcdqyXmnCFcYoyWcM6n4geNJjqT482iQJ9ZeviQNcwoRL0oOj964EyK1gGA31/tjbUQH3XQwqmmxtlOyJWiUYsWKVkynzrLyg/touooMANxhTmjgDtcPXYwpNWmERo37fqdgCSwMuzaOEn9R78F80RigI6w4mbJD8FSdoBjwU83XAUoSjZMwy55/SQ8BADo7ccLt0mymZBdFfxMWNKMnxpJYFjfZ1q47MkDe4WZ6ksRqP523+E39wVbeT+5DdpAw8+gFFira5Q8nIG1yopMouiKg36mEZDys224pSlxADoHrH6bHchiluTAJLUn/FrG9WioOKkKKuk1jhVGpKcqN08Uk4UOZcTeRelIWXWi4kB1Ikpy64VEwOQxZQnl2dY6K+a6vAcb1dJ2ABRjBDL5EuJlmU3xMAp5BxCf4MPlZDnKvyrVHDYS7IAgA5UdeynNKkIfUi2VQ/4RFyprt+2zK6YkCkJzZuLC9XE/2WVQ9/zHC9uwI7Ih+4ys42tKqHI7eoxyOVOF6M4E6DwFbtcRrHof7KUDtlI18j9jyk9ENconV3Hq76hq8WD/HipTcciZ+o1vISGXyEQa/BuxoZxgf+87HVYjwgJvuMUiecWld8bzp+XQXeq3BGs2Q0UyJUdAZdNW3pDq8ghjbyhV2Sx5t1ww5tyZlarigNVPAk/PUjTOBjAYN5sEA1v8aqVAnGjCF/a+noBPkaxcuSWQJZP6jOorDf/R4SPZ7VlIiy7EEB1fmOTzOfJyeRR1CrHMfJnmmobWNkJW0sgGWEqkbfQUWE9s9TGrsyDNJB/PR6wMyrzgPdhSUAPC9eVpx8SobWjdWVKzAPLH3H6inHojGadi5kDiOE57pr1xRvyrhsMHFJPhwEg3DhFYv2oLxiHnuGTXkE4PpwEwMx74VAwt+QTwrTofSaub+4ySmyq0s5Jk9gLCOq3yhWhLAbA+fw1O0FyFzcL03E44hIPA+mQOYI0gcq5roDnY63VUySUNn9QG2tB/FwmQ4nUCmHSJZwcP7O+/UJ0NEW6fGsVu5KfL3JPAxVNEqRoKSQLg+/Nttqx0P/SOro/lS6J+JIaKqKdsPhtyVgKITBrwYNTw3P+nr2KvSiPJq2KgRN5V4lg56P5JKt8RnuZJRfz21V2zIjmCLidZ6U8OW7EU1OjdKd4uSODIlXeygoj34QHOdJoVoUFyQUSfBFwiFx3itOzORbJKPDIVwEze1WyjEpzClz6nUO+r3ifZdmyA2cHJPTbVgSR8N3RsgWHUriLPohJInB5Abi0wtGHr0J8q4Y+13WKEuS7zpitBq0ilq8g8NRYEIcjR1MKevfSqXQcmIAaui9ky1BS7GuhVjufwTDjY/6LOJoeM8+0+hihsDsAbzvx+gt6fQZbDyepzesg9KLrjudfwQyDlEqAhMv5a2DwtSthc49cjKZs80Xh11XFie//zHKAA+9inqRTGgOUCqqlWv/izjBJ+osPZNpHHimJE3qevyn70IIceCyp7iJBTa4OYgvo30uVaCnfck9q7JUuOPmyJd3qKzAfRNOdp1GjRk1kzRLtkK8hvwnt+0pN1jWqFQvO0MZIgdzFVbyHJSyhUf6u3XR4ztmt3GLYphTfC8SLhplZTRH9DeY2f2vGPgkok1dKv7mrMbx7b4ZdkBQWmbBpfal8hZbNbo2RQgDDczJp3MrRudGoqj/gRyup4lzcIvtACy4HHupKvS9NIuuDFmIll3Ru+QVyE4+uM3Pk6W1OkJyBLq/zE0FzyTCOJpNngk92RwbdqhLwOUPCwZYy8M/dqwAfcm3gFUtumDbu5TL4iTQp51WYRr8E/nXzrgIdaE6i4SWkhL4LRlQQvBcPvZflOY3mCbEMlKkcQ8suP8J9piA5fsMphrZo5X7dUoovn4Q+LcOsOAGdT0dps2SP9ZLAbxT63A2S0iyuDrDuMuj8NOTZlXRNYr75KK/ZOoUSQdezR9eiBS99xXSTbJolB6Jr1tBKZaSS97K6CHLgY3URqA5xQaz65kmh7HoBL7kyp7W7hiHIouaCE+AaAURXzkOPyfeyhbKcMjVNmryZE6hGfplFCSRsll6FTq4UK5oDtHSej31FVb77ThAZD7wpAdOpF8exOEGUpMW2PjSE+24lGDY7lmaO6y0di9XKqi7ZTsXkrZLNSg7WKnqzrui6ygoSua/R1KdcUy+zyfkSVX3KVZVD87p6WTGbl3gj7Xa5rrL14i9U1qcvUVa5e3mArj49QFfF4nij9gjIWsNXRD0CefRac4hZa4BZyQiJ060aQ99nRw0eOZJm+OXhtHwqBgEePzieFaMiLXRXvlH17Kp8A+xyLqpv9sgDoOLI0zjEDN/bwWC5ZI0r7kOWK1O67qTqZ73BShFfzKo+UiSeqFolk5qDWCU0+V2A6htC1rLV63Pfn1TZatY/upMUyi0Htjx/krqfcIpBcVsdmlJwhdjsevkjf+SC4cgh0eIt6pLT3sK3F4p8Slt692app8/LpAyI+9oldtnUAEYNhPsJ+J6sOWXP76fjEQVCu/JB6DJH+4q5qnbtPcWU7U8o9WkNu3ibTek6G5Fd4eumeIKx6qhfbT2eKu2VFdlcVZH9uooE4YMq0l5dkYrFTJ7E+nPg8ofHLb2UJ5V3ciSXNMwhwf3Ex/0whKtsSzb8vdTnNSUJCdBCHJcGm7nCfpWXe75maVVz2UJfFdfVztwkCa78HfqAy72wJla1i2KZAisDGKULa2mg6l3oH7Fne77edbXi7UL8RaMVm19p8IIBZSkVcHm4mAelibvi9UzlK/TWv0SvdI2eeAle+dq8Uj5lIZV3i9VfjFe+F4k8KEHfbWCDP941AVaCWyJ2uIeWwHLYqCudjM0PFj1iF2ntER5t6M4adVDF6Z2lYFMScaQ6b6gd2/KntbCcxxqEeHtHW5w5l9YVqo+aVAOjczyakMPAjStq0rWwy08bVUis9hyFDIm1ymfmDb1jNdaK764KX9fVeZ5igURJs4V0ZOPJsrNh+SEvoREstQ8epM44eJiaDchPpEXnDzgslK4xx5znk9JcfE2Lr6t1RpZ3jliSXHed37tcAqs8/KJgUB6bAEw18+VMjezzgpEoq2x208C9P/2tlv7Szdsl6Cy40raW8VzMYjVtGZyw/X3oh/zFOuWiBXvXqgDF6ZI8INzL9kBHgD+OSdD6/tusgsV6/u0mkQ38olXUbVnKdVm+w5+d8b1jjwVIPtFOOYn6cRXX6e9UJSL0/e6T+xbxwtLzgLgA76MofRt5frPVOY+SFGabozDpZAGo7EZG+Lj7dBs852CW7j/dTmPfT4YwBLTjedg+92N//ylucFfIDqu9jVE08fA1j7MQKG/sPyVy2n9KFpYU9Bz2Nobn/vAS6rBRiXOWRuPxBFG3CZJIntz2ceYOBjAL3tj/bpLu8tmNMEpJZmP/wl10iBAUYB4gBDI4Rw8LwAyEXR7f1LcUrduqIaz813/+D7Vjacr/+d9qxzCUk//6z/+ldlTV6m1B1v9UOz37VAmj8NaPox1DX1F6lp39YuLiq0yg/QWkeL63IebhgXGwSO9siBYGVrI0HzJxGyjLy7R7ltulhCw9s7Gx/z4b6qlldDqdjO9KqyAmw3QO7WASDEmb2I6GqZ+2E8Bxpxv7+dtZtF0R46Tf0DZ389jIiLwXsNR2dylYB3g4jqIwe1+DkUhnLPqA3a7wqkizkfrTGfotSMePYxAYeIh48qTwZenzCK+P373tkJl0Ewl22AFxmR6te6MldBpADVHyB0YUscF1qh7HoOwWL2tgp7GiNWZ1ydQoVGljiV4ukgjs524DN0du7CgbRzT+lt+wA9MHjBrChFlxyU6AVkd5iR7sNk3HPV30WQQScdzYUja4xxCQovX5xa994+LZuwtrHP19vHlwtG30h88+vz+yu9qH8Xb/6v1R3zq4fXlk/hAZb7bHz26v+28OopsL4810rG6/emtv9j+MtR+OnOvo14/bv4TDRV+b+e8+9K6tz6823/afve+r1+7rI0edRZ829de95/3kePz+YvvVay3ZDl++ft+33w/C2675QjvY1o7+cdu/Pvzp+iJNkuNk2wt+MfrW4fPehbqXs0/egEDuWfeAGdJ7C5h78PPzZ2v+I7S5SyAA/W7D1eCXhoWq+KELs6qN4hQwJJ3cbeABCCwLYCGX9BXkK0ApGiJhMjn+AMkwb9uABkuJncKXmzpqapmauqPo1cR0Qks6eIUEMVm8jInUK5NecW0T0gWXAhLb0Ft2LVOzDMuxTMPodTHLXWCBFTksIAy5dCa6kV+fTRCwDza6PUfVTdvs2Rb2yBv5tdo1NLMXprEGJ5iCBxsM8vStZpj0q6mRr10bcrr4j3x14KONj/jSrz0HgFV8bZC+EKzidwNY0DT6ILCGCTY+aWnRBB0SdNWAhB59etfEIxZYgm5QCFXHQxbkP1pIF9F7+AKiqpIEDY9i2CpJxQTbQpaxJIdgGPhRN/LvSKxn5uBYYhcr3SWP+xpAzUSKmnZ6igYoHEIAEdnU9uti+dSuMo2z9ws3MhxiXNiiNjDWtBTsRAQh96KQBgkGV5hs8SIZ2mWWkJnpqjLg84pCtFIhWlcshTTT5cWcrq7tf4QKDC0iHM28P73ne3vWs8NHGMdLvkPJ0ZC8pWVexT+VI7IRakc57H9UVEbsu3G6W10KZQC9CeI/wyhDwyQ76Pr4G0rgoVsXn+WDz0jvap6l691ur2c6mtcbDixTHYxsaLKm6wwYe/A/0tunDxCBazLFedGZwO0OOGPNjuA07py7SXOfOk+dKneS4OwQz9P38BqHFvELJhgc/atLfmBshdqR0n8fj1Zhxa/j2VZkVcqiSqsAPnFnCWYSB7nCMCQaf610kv+/daaXSqTepH9n35sIsHlyonYcUzc0U1PISw+ObthOF9+17ei6rdkOS9dVW7e6Bvnc0xwYjOwieA+zc11XNUshsDaMaqbVpXiWDu3KJPR6FgwNXYOkq3rP0FSzy9NQe46tqZaJ+ZYFLBl6l5ZtmqataSS9B5R1ldHrmT3VUXga3Z4BbOtK8bLvCTJnqgiMSAbw3jUNQsCBYcvWTFJI19RUvUsLhN89p2s7PGGtBxXssgraltNTaQUdq6valk3wHKBtWZQ5QwO2u5bAnKPpTlfrKZR5MCvLIHiZp0D4ABHZrBzmHghCAkUYtqoapzBAkte59phlt2rM6Mv6SVftjhzd810X+sehMXAds2f5juqPVMt1RnrRTy6dFectFgM3lG3ygtmWcu27l2ck4QNeHV3VHh7KszawfDClodGze2B7/sD1VddWB/7QGvS6g0Elz/8dAgXoDljL+zbTpH2blvdttpH1bU7Rtznqn4GCPwMFfwYKssn0wcurd9cHl59vF77+7Odt7fmPVn/87PIfR9b1h9HPvecv3xz0Zz9FLz8415fOq97kzQu7rwaH+gfr88tfPm5fvr190T8+N90j+2MQf9z8NbmMcaJv3+oHxuj55ubrTynQG99+uP00GV9ughS3++PgB/fI+eGzGm2rL186/Y/PjiYX5o9/fx5tT16+v+1fHyfxhemMDz5ux8+D5/3oSHv5wXBevv24GU3fH/dvDy8XF8b48Nc3m+Mfohf9V4ev+7dGMvz8ZjN6e3nd//nZ7Or2evzLx6j3+sf+q34abA4/2Mevjofb45fmoj+1E/9oe3x09Gn77durq/7n8x/f324f9n55vp28OzjqT16//vlD7+eoq/b0+avjvnr47tcL7fns86vN6/Fw0bfPZ+6RefMJ6v/i3e2zfnh0c/DBSRYvou3F4YsP/d7NjXfkPP/h43D73biX9LcPw2dH1g/JUbTtxMNe//bgZ+NWuzSnH7dvDm8xGHPcvegm6sHz7V9e/eOwb17oby+cJPQ+bg7fBGl/evjs51vn9wyUfOm/NQIt1iPiLFZ1ZMR6TJRlRczm68VZHMPUdXAIbbtrOj2DD7SUs1ZGWmxwJ8GbMxwNnDvL0sqRljLRP0Mt/01CLY+Igjwm2GKJpVh/hlrWDLWYrtsduNbA73bNoWkODN0cdUembQ2Mke3Zv687/seMcvwbZgL/r0c5skGCRh9Up6dpPRJRcDRTx4k6Ttq7mmPYdCKu6wbMtG1diCQAju44Bg2D6JZpkKEEZu1a1zEUOmtXcWpv0zAHG3bEcISpm46u07iKA43BUTWG2O1qLF3XbWSShAcMy7Rs0xGJdG1NNTXstpGrbq9rGiS+Ydq60TNU8hmSLRhENFplS7VVrSdWxzCNrmkSORi2YeuMSE919J6lkUCG3YPhT8+iQIbeNXDM4oiAVE0H5EaBVVO1HJtFOHo9m0ZJDBPGwq5GYIAl07F7lkjEcoxul4ZoYBi3uiZl24Txyeiy8AoMpCAsg8mqB6qQiEAdTD2LqYBeDZVwoppAQevRaoIGQc0UxjQ0u6uLMlF1w+ha1B5Us2f0bIsi9mAg7XVpgMjoqlADQrxrARs9STuabRhQZ2JsPdCIZdPQmQ3jK13pgap1HbPboxEn24aa6T2RiIMhta7OJO/YTteh4SfLAm0yY3NMQKWaskCDtqmIRFRcWjIdh9bd7tomFWa3p1m62WXGBhWz7B41SMMCwRkCEcN2bMukrIIZdVXLogE0sEzLclgwzQTps8AVJppyFA5+oMkQIj2wf2gj1ErB1EAWhENoorql0yrbpqY6oG5RsNhwmUacHjRVyybAJrQ0x7GIkKG1wEjDjA2MvqdK1QF8p5uVoploSTY1NjB006bxO6Nngmdn0oCmAYoCNwo8Jbql5vcPvA3B8LuaCpYDkjSxo+mZnu11PZAW2IrzLwu8fXGIhN6J98ojF3IXs3poHj50sO7ANkAFQx+a62hkuIan265p90ZkrrT2cg0PvDJmyQOvDBYKbKxyZXjglRo83WUxomgYR1FaGSXKAjmoBQbEwKXQzUYnV9QZZm+UUA8nEdnmmn3vDDGBFENe7dstcmIfbHPo/z1Iz5sCek50FLtjdoeGtHfwiH19wSCwDhm0sP8sI4z5Fdfv5GYjXb9DjuKk2f0YOWX4ynYtPrt5BcQzbHwYa5fgJNE8HvpH5OK5Ghn+FZvghrKpSOjsWkdeLDm1ziiIk6xsUjNAKHKLqNm9qIlKIa8Kkv1fG6qZng==</script> <treescope-run-here><script type=\"application/octet-stream\"> const root = ( Array.from(document.getElementsByClassName( \"treescope_out_499803137f5041bf92c9808947b11c6d\")) .filter((elt) => !elt.dataset['step1']) )[0]; root.dataset['step1'] = 1; root.defns.insertContent( this.parentNode.querySelector('script[type=\"application/octet-stream\"]'), true ); this.parentNode.remove(); </script></treescope-run-here> </div>"
+      ],
+      "text/plain": [
+       "<IPython.core.display.HTML object>"
+      ]
+     },
+     "metadata": {},
+     "output_type": "display_data"
+    }
+   ],
+   "source": [
+    "class MLP(nnx.Pytree):\n",
+    "  def __init__(self, din: int, dmid: int, dout: int, *, rngs: nnx.Rngs):\n",
+    "    self.din, self.dmid, self.dout = din, dmid, dout  # static attributes\n",
+    "    self.linear1 = Linear(din, dmid, rngs=rngs)             # data attribute\n",
+    "    self.linear2 = Linear(dmid, dout, rngs=rngs)            # data attribute\n",
+    "\n",
+    "  def __call__(self, x: jax.Array):\n",
+    "    x = nnx.relu(self.linear1(x))\n",
+    "    return self.linear2(x)\n",
+    "\n",
+    "mlp = MLP(2, 16, 5, rngs=nnx.Rngs(0))\n",
+    "y = mlp(jnp.ones((3, 2)))\n",
+    "print(f'{y.shape = }')\n",
+    "\n",
+    "nnx.display(mlp)"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Because the entire model is a single pytree, all the `jax.tree.*` functions, JAX transforms, and NNX state APIs work on the full nested structure at once. For more info check out the [Pytree guide](https://flax.readthedocs.io/en/latest/guides/pytree.html)."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## JAX Transforms\n",
+    "\n",
+    "NNX models can be passed directly to JAX transforms like `jax.jit`. However, JAX transforms create pure functions, meaning that they won't propagate side effects such as Variable state updates back to the caller:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 6,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "0\n"
+     ]
+    }
+   ],
+   "source": [
+    "model = Linear(2, 5, rngs=nnx.Rngs(0))\n",
+    "\n",
+    "@jax.jit\n",
+    "def forward(model, x): # pure function\n",
+    "  y = model(x)\n",
+    "  return y\n",
+    "\n",
+    "y = forward(model, x)\n",
+    "\n",
+    "print(model.count[...]) # no state update"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Here `count` was not updated because inside `jax.jit` new Variable copies are created so any updates inside will not be reflected outside. To propagate updates we can use two NNX helpers. `nnx.state(obj, *filters)` extracts the current state of all Variables in `obj` as a nested `State` dict; you can pass **filters** to select specific Variable types, for example `nnx.state(model, Count)` extracts only `Count` Variables (see the [Filters guide](https://flax.readthedocs.io/en/latest/guides/filters_guide.html) for details). `nnx.update(obj, state)` writes a `State` back into the corresponding Variables of `obj`."
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 7,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "1\n"
+     ]
+    }
+   ],
+   "source": [
+    "model = Linear(2, 5, rngs=nnx.Rngs(0))\n",
+    "\n",
+    "@jax.jit\n",
+    "def forward(model, x):\n",
+    "  y = model(x)\n",
+    "  return y, nnx.state(model, Count)  # propagate state\n",
+    "\n",
+    "y, updates = forward(model, x)\n",
+    "nnx.update(model, updates)  # apply state updates\n",
+    "\n",
+    "print(model.count[...])  # updated successfully"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "In this example we could've also chosen to return the entire `model` and replace its reference outside, however the use `nnx.state/update` is preferred as NNX promotes preserving existing Variable references."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "### Training step with JAX transforms\n",
+    "\n",
+    "For a full training step we also need to differentiate with respect to some parameters while keeping the rest non-differentiable. `nnx.split` and `nnx.merge` let us partition and reconstruct the model. `nnx.split(obj, *filters)` returns a structure definition (`GraphDef`) followed by one `State` group per filter, where the catch-all filter `...` matches everything not yet matched by a previous filter (see the [Filters guide](https://flax.readthedocs.io/en/latest/guides/filters_guide.html) for the full filter language). `nnx.merge(graphdef, *states)` reconstructs a copy of the object from its definition and state groups. We will use these to select the differentiable parameters when passing them to `jax.grad`.\n",
+    "\n",
+    "The example below shows a complete training step using raw JAX transforms. `nnx.Optimizer` wraps an [Optax](https://optax.readthedocs.io/) optimizer and stores its internal state as Variables, providing a simple `update(model, grads)` method that performs in-place updates to both the optimizer state and model parameters:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 8,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "model.count[...] = Array(1, dtype=int32, weak_type=True)\n",
+      "optimizer.step[...] = Array(1, dtype=uint32)\n"
+     ]
+    }
+   ],
+   "source": [
+    "import optax\n",
+    "\n",
+    "x, y = jnp.ones((3, 2)), jnp.ones((3, 5))\n",
+    "model = Linear(2, 5, rngs=nnx.Rngs(0))\n",
+    "optimizer = nnx.Optimizer(model, optax.adam(1e-3), wrt=nnx.Param)\n",
+    "\n",
+    "@jax.jit\n",
+    "def train_step(model, optimizer, x, y):\n",
+    "  # use same filter as Optimizer's `wrt`\n",
+    "  graphdef, params, nondiff = nnx.split(model, nnx.Param, ...)\n",
+    "\n",
+    "  def loss_fn(params, nondiff):\n",
+    "    nondiff = nnx.clone(nondiff) # refresh trace state\n",
+    "    model = nnx.merge(graphdef, params, nondiff)\n",
+    "    loss = jnp.mean((model(x) - y) ** 2)\n",
+    "    return loss, nnx.state(model, Count)  # propagate state\n",
+    "\n",
+    "  grads, updates = jax.grad(loss_fn, has_aux=True)(params, nondiff)\n",
+    "  nnx.update(model, updates)\n",
+    "  optimizer.update(model, grads)\n",
+    "\n",
+    "  return nnx.state((model, optimizer))\n",
+    "\n",
+    "updates = train_step(model, optimizer, x, y)\n",
+    "nnx.update((model, optimizer), updates)\n",
+    "\n",
+    "print(f'{model.count[...] = }')\n",
+    "print(f'{optimizer.step[...] = }')"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "A few things to note. The state of the `model` and `optimizer` is extracted at once by packing them in a tuple (or any pytree), and `nnx.update` accepts the same structure. By default `jax.grad` differentiates with respect to the first positional argument only, `params` in our case. Finally, `nnx.clone` is needed because `jax.grad` passes non differentiable inputs (here `nondiff`) directly without tracing them, so we must manually clone them to refresh the trace state of their Variables - preventing tracer leakage. Omitting `nnx.clone` raises an error."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## NNX Transforms\n",
+    "\n",
+    "NNX transforms (`nnx.jit`, `nnx.grad`, ...) are thin wrappers over JAX transforms that provide the exact same APIs. Their main feature is **automatic state propagation**: the state of all input Variables is tracked and updated automatically behind the scenes. This removes the need for the `nnx.state/update` boilerplate and the use of `nnx.clone`:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 9,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "model.count[...] = Array(1, dtype=int32, weak_type=True)\n",
+      "optimizer.step[...] = Array(1, dtype=uint32)\n"
+     ]
+    }
+   ],
+   "source": [
+    "x, y = jnp.ones((3, 2)), jnp.ones((3, 5))\n",
+    "model = Linear(2, 5, rngs=nnx.Rngs(0))\n",
+    "optimizer = nnx.Optimizer(model, optax.adam(1e-3), wrt=nnx.Param)\n",
+    "\n",
+    "@nnx.jit  # automatic state propagation\n",
+    "def train_step(model, optimizer, x, y):\n",
+    "  # use same filter as Optimizer's `wrt`\n",
+    "  graphdef, params, nondiff = nnx.split(model, nnx.Param, ...)\n",
+    "\n",
+    "  def loss_fn(params, nondiff):\n",
+    "    model = nnx.merge(graphdef, params, nondiff)\n",
+    "    loss = jnp.mean((model(x) - y) ** 2)\n",
+    "    return loss\n",
+    "\n",
+    "  grads = nnx.grad(loss_fn)(params, nondiff)\n",
+    "  optimizer.update(model, grads)\n",
+    "\n",
+    "train_step(model, optimizer, x, y)\n",
+    "\n",
+    "print(f'{model.count[...] = }')\n",
+    "print(f'{optimizer.step[...] = }')"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "Notice that `train_step` doesn't need to return anthing as `nnx.jit` propagates all Variable updates (model parameters, optimizer state, counts) automatically."
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Graph Mode\n",
+    "\n",
+    "Certain programs are easier to express by sharing references between objets on different parts of a structure, however this is not compatible with JAX's pytree model. If we create a simple model that shares a reference to the same Variable in two different attributes, NNX transforms and most other APIs will raise an error as sharing can result in inconsistencies:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 10,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Error: Variable at [0][0].b was already seen at [0][0].a. tree-mode jit does not support shared Variable references.\n"
+     ]
+    }
+   ],
+   "source": [
+    "@nnx.dataclass\n",
+    "class Foo(nnx.Module):\n",
+    "  a: nnx.Param\n",
+    "  b: nnx.Param\n",
+    "\n",
+    "p = nnx.Param(jnp.array(1.0))\n",
+    "model = Foo(p, p)  # shared Param\n",
+    "\n",
+    "@nnx.jit\n",
+    "def forward(model, x):\n",
+    "  model.a[...] += 1.0\n",
+    "  return model.a * x + model.b\n",
+    "\n",
+    "try:\n",
+    "  forward(model, jnp.array(1.0))\n",
+    "except ValueError as e:\n",
+    "  print(f'Error: {e}')"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "However, at the cost of some python overhead, `graph=True` can be passed to NNX APIs to enable **graph mode**. In graph mode, general graphs structures are allowed as long as they Variables are transformed consistently. We can fix the above example by enabling graph mode in `nnx.jit`:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 11,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "y = 6.0, model.a[...] = 3.0, model.b[...] = 3.0\n"
+     ]
+    }
+   ],
+   "source": [
+    "@nnx.jit(graph=True)\n",
+    "def forward(model, x):\n",
+    "  model.a[...] += 1.0\n",
+    "  return model.a * x + model.b\n",
+    "\n",
+    "y = forward(model, jnp.array(1.0))\n",
+    "\n",
+    "print(f'{y = !s}, {model.a[...] = !s}, {model.b[...] = !s}')"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## Hijax (experimental)\n",
+    "\n",
+    "JAX's experimental **Hijax** API allows custom mutable types whose state updates propagate automatically through JAX transforms. When enabled via `nnx.var_default(hijax=True)`, plain JAX transforms like `jax.jit` handle state propagation of `Variable`s without any manual `nnx.state` / `nnx.update` calls. As a bonus, in hijax mode Variables can also be passed as captures, further simplifying the loss function:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 12,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "\u001b[38;2;79;201;177mLinear\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # Count: 1 (4 B), Param: 10 (40 B), Total: 11 (44 B)\u001b[0m\n",
+      "  \u001b[38;2;156;220;254mdin\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;182;207;169m2\u001b[0m,\n",
+      "  \u001b[38;2;156;220;254mdout\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;182;207;169m5\u001b[0m,\n",
+      "  \u001b[38;2;156;220;254mw\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mParam\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # 10 (40 B)\u001b[0m\n",
+      "    \u001b[38;2;156;220;254mvalue\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mArray\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;156;220;254mshape\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;182;207;169m2\u001b[0m, \u001b[38;2;182;207;169m5\u001b[0m\u001b[38;2;255;213;3m)\u001b[0m, \u001b[38;2;156;220;254mdtype\u001b[0m\u001b[38;2;212;212;212m=\u001b[0mdtype('float32')\u001b[38;2;255;213;3m)\u001b[0m,\n",
+      "    \u001b[38;2;156;220;254mhijax\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;86;156;214mTrue\u001b[0m\n",
+      "  \u001b[38;2;255;213;3m)\u001b[0m,\n",
+      "  \u001b[38;2;156;220;254mcount\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;79;201;177mCount\u001b[0m\u001b[38;2;255;213;3m(\u001b[0m\u001b[38;2;105;105;105m # 1 (4 B)\u001b[0m\n",
+      "    \u001b[38;2;156;220;254mvalue\u001b[0m\u001b[38;2;212;212;212m=\u001b[0mArray(0, dtype=int32, weak_type=True),\n",
+      "    \u001b[38;2;156;220;254mhijax\u001b[0m\u001b[38;2;212;212;212m=\u001b[0m\u001b[38;2;86;156;214mTrue\u001b[0m\n",
+      "  \u001b[38;2;255;213;3m)\u001b[0m\n",
+      "\u001b[38;2;255;213;3m)\u001b[0m\n",
+      "model.count[...] = Array(1, dtype=int32, weak_type=True)\n",
+      "optimizer.step[...] = Array(1, dtype=uint32)\n"
+     ]
+    }
+   ],
+   "source": [
+    "with nnx.var_defaults(hijax=True): # enables Hijax Variables\n",
+    "  x, y = jnp.ones((3, 2)), jnp.ones((3, 5))\n",
+    "  model = Linear(2, 5, rngs=nnx.Rngs(0))\n",
+    "  optimizer = nnx.Optimizer(model, optax.adam(1e-3), wrt=nnx.Param)\n",
+    "\n",
+    "print(model)  # display Hijax Variables\n",
+    "\n",
+    "@jax.jit  # automatic state propagation\n",
+    "def train_step(model, optimizer, x, y):\n",
+    "  # use same filter as Optimizer's `wrt`\n",
+    "  graphdef, params, nondiff = nnx.split(model, nnx.Param, ...)\n",
+    "\n",
+    "  def loss_fn(params):\n",
+    "    model = nnx.merge(graphdef, params, nondiff)\n",
+    "    loss = jnp.mean((model(x) - y) ** 2)\n",
+    "    return loss\n",
+    "\n",
+    "  grads = jax.grad(loss_fn)(nnx.vars_as(params, hijax=False))  # disable hijax for param grads\n",
+    "  optimizer.update(model, grads)\n",
+    "\n",
+    "train_step(model, optimizer, x, y)\n",
+    "\n",
+    "print(f'{model.count[...] = }')\n",
+    "print(f'{optimizer.step[...] = }')"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "As a temporary limitation, `jax.grad` does not yet handle mutable Hijax types. We work around this by converting `params` to regular Variables via `nnx.vars_as(params, hijax=False)` before passing them to `grad`. Hijax can also be enabled on a per-Variable basis by passing `hijax=True` to the constructor:"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 13,
+   "metadata": {},
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "v[...] = 1\n",
+      "v[...] = 2\n"
+     ]
+    }
+   ],
+   "source": [
+    "v = nnx.Variable(jnp.array(1), hijax=True)\n",
+    "\n",
+    "@jax.jit\n",
+    "def inc(v):\n",
+    "  v[...] += 1\n",
+    "\n",
+    "print(f'{v[...] = !s}')\n",
+    "inc(v)\n",
+    "print(f'{v[...] = !s}')"
+   ]
+  }
+ ],
+ "metadata": {
+  "jupytext": {
+   "formats": "ipynb,md:myst"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.11.9"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 4
+}
diff --git a/docs_nnx/nnx_basics_tree.md b/docs_nnx/nnx_basics_tree.md
new file mode 100644
index 000000000..2bdc6f577
--- /dev/null
+++ b/docs_nnx/nnx_basics_tree.md
@@ -0,0 +1,319 @@
+---
+jupytext:
+  formats: ipynb,md:myst
+  text_representation:
+    extension: .md
+    format_name: myst
+    format_version: 0.13
+    jupytext_version: 1.13.8
+---
+
+# NNX Basics
+
+NNX is a Neural Networks library for JAX. NNX provides the tools to structure modeling code as [JAX pytrees](https://jax.readthedocs.io/en/latest/pytrees.html) so it can work with transforms, `jax.tree.*` utilities, and all standard JAX APIs. This guide covers the core concepts you need to get started.
+
+```{code-cell} ipython3
+from flax import nnx
+import jax
+import jax.numpy as jnp
+
+nnx.graphlib.set_graph_mode(False)
+nnx.graphlib.set_graph_updates(False)
+```
+
+NNX's main build blocks are:
+
+- **`nnx.Pytree`**: Base class for pytree-compatible objects. Defines the tree structure of your model.
+- **`nnx.Variable`**: Wraps array data and tracks mutable state. Subclasses like `nnx.Param` categorize different kinds of state.
+- **State APIs** (`nnx.{state, split, merge, update}`): Extract, partition, reconstruct, and apply state updates.
+- **NNX Transforms** (`nnx.{jit, grad, scan, ...}`): Thin wrappers over JAX transforms that automate state propagation.
+
++++
+
+## Pytrees and Variables
+
+`nnx.Pytree` and `nnx.Variable` are two orthogonal systems. **Pytrees** define the structure of your model as a JAX-compatible tree. **Variables** wrap array data and enable expressing state updates via in-place mutation. 
+
+`Pytree`s are python objects that define its tree structure dynamically through its attributes, these are split into two categories: **Static attributes** (e.g. `int`, `str`) are embedded in the tree structure definition and are not traced by JAX. **Data attributes** (e.g. `nnx.Variable`, `jax.Array`) are the leaves of the tree and are traced by JAX. For more details see the [Pytree guide](https://flax.readthedocs.io/en/latest/guides/pytree.html).
+
+Here's a typical layer definition:
+
+```{code-cell} ipython3
+class Count(nnx.Variable): pass  # custom Variable types
+
+class Linear(nnx.Pytree):
+  def __init__(self, din: int, dout: int, *, rngs: nnx.Rngs):
+    self.din, self.dout = din, dout                                # static attributes
+    self.w = nnx.Param(rngs.uniform((din, dout)))  # data attribute
+    self.count = Count(jnp.array(0))                            # data attribute
+
+  def __call__(self, x: jax.Array):
+    self.count[...] += 1  # inplace state updates
+    return x @ self.w     # Variable are Array-like
+
+model = Linear(2, 5, rngs=nnx.Rngs(0))
+
+nnx.display(model)
+```
+
+> **Note:** Most user code uses `nnx.Module`, which is a subclass of `nnx.Pytree` with additional features such as sopport for metric reporting.
+
+As we can see above, Variables are array-like; they support arithmetic operators, indexing, and can be used directly in JAX expressions. You can update their value in-place using `variable[...] = new_value`. Since NNX Pytrees are standard JAX pytrees, you can use `jax.tree.*` functions directly on them:
+
+```{code-cell} ipython3
+x = jnp.ones((3, 2))
+y = model(x)
+print(f'{y.shape = }, {model.count[...] = }')
+
+# jax.tree.map works directly on NNX Pytrees
+doubled_model = jax.tree.map(lambda x: x * 2, model)
+print(f'\nmodel.w sum:   {model.w.sum():.4f}')
+print(f'doubled.w sum: {doubled_model.w.sum():.4f}')
+
+# jax.tree.leaves_with_path shows the full tree structure
+print('\nPytree leaves:')
+for path, value in jax.tree.leaves_with_path(model):
+  print(f'{jax.tree_util.keystr(path)}: {value!r}')
+```
+
+Here `jax.tree.map` was first used create a new model with each leaf Array doubled, and then `jax.tree.flatten_with_path` was used to show how JAX sees the tree structure. Notice that because Variables are also JAX pytrees containing a single element (their inner value) we see `value` as part of the leaf path.
+
++++
+
+## Rngs
+`nnx.Rngs` simplify managing [JAX PRNG state](https://jax.readthedocs.io/en/latest/random-numbers.html). It is itself an `nnx.Pytree` that stores a seed `key` and an incrementing `counter` in `Variable`s internally. By calling it, `Rngs` can produce new PRNG keys:
+
+```{code-cell} ipython3
+rngs = nnx.Rngs(0)  # seeded with 0
+
+key1 = rngs()       # get a raw key
+key2 = rngs()       # different key (counter incremented)
+arr = rngs.normal((2, 3))  # draw samples directly
+
+print(f'{key1 = }')
+print(f'{key2 = }')
+print(f'{arr = }')
+print(rngs)
+```
+
+As we've seen so far, `Rngs` conveniently exposes every `jax.random.*` distribution as a method (e.g. `rngs.uniform(...)`, `rngs.normal(...)`) without requiring the `key` argument and returning different random values every time they are called, this highly simplifies the user experience. In general `Rngs` can hold multiple keys and counters in structures called `RngStream`s, above we see that the `default` stream is being used. For more information check out the [Randomness guide](https://flax.readthedocs.io/en/latest/guides/randomness.html).
+
++++
+
+## Nested Modules
+
+Pytree subclasses compose naturally, you can assign one as an attribute of another to build nested models. The example below builds a simple `MLP` from two `Linear` layers:
+
+```{code-cell} ipython3
+class MLP(nnx.Pytree):
+  def __init__(self, din: int, dmid: int, dout: int, *, rngs: nnx.Rngs):
+    self.din, self.dmid, self.dout = din, dmid, dout  # static attributes
+    self.linear1 = Linear(din, dmid, rngs=rngs)             # data attribute
+    self.linear2 = Linear(dmid, dout, rngs=rngs)            # data attribute
+
+  def __call__(self, x: jax.Array):
+    x = nnx.relu(self.linear1(x))
+    return self.linear2(x)
+
+mlp = MLP(2, 16, 5, rngs=nnx.Rngs(0))
+y = mlp(jnp.ones((3, 2)))
+print(f'{y.shape = }')
+
+nnx.display(mlp)
+```
+
+Because the entire model is a single pytree, all the `jax.tree.*` functions, JAX transforms, and NNX state APIs work on the full nested structure at once. For more info check out the [Pytree guide](https://flax.readthedocs.io/en/latest/guides/pytree.html).
+
++++
+
+## JAX Transforms
+
+NNX models can be passed directly to JAX transforms like `jax.jit`. However, JAX transforms create pure functions, meaning that they won't propagate side effects such as Variable state updates back to the caller:
+
+```{code-cell} ipython3
+model = Linear(2, 5, rngs=nnx.Rngs(0))
+
+@jax.jit
+def forward(model, x): # pure function
+  y = model(x)
+  return y
+
+y = forward(model, x)
+
+print(model.count[...]) # no state update
+```
+
+Here `count` was not updated because inside `jax.jit` new Variable copies are created so any updates inside will not be reflected outside. To propagate updates we can use two NNX helpers. `nnx.state(obj, *filters)` extracts the current state of all Variables in `obj` as a nested `State` dict; you can pass **filters** to select specific Variable types, for example `nnx.state(model, Count)` extracts only `Count` Variables (see the [Filters guide](https://flax.readthedocs.io/en/latest/guides/filters_guide.html) for details). `nnx.update(obj, state)` writes a `State` back into the corresponding Variables of `obj`.
+
+```{code-cell} ipython3
+model = Linear(2, 5, rngs=nnx.Rngs(0))
+
+@jax.jit
+def forward(model, x):
+  y = model(x)
+  return y, nnx.state(model, Count)  # propagate state
+
+y, updates = forward(model, x)
+nnx.update(model, updates)  # apply state updates
+
+print(model.count[...])  # updated successfully
+```
+
+In this example we could've also chosen to return the entire `model` and replace its reference outside, however the use `nnx.state/update` is preferred as NNX promotes preserving existing Variable references.
+
++++
+
+### Training step with JAX transforms
+
+For a full training step we also need to differentiate with respect to some parameters while keeping the rest non-differentiable. `nnx.split` and `nnx.merge` let us partition and reconstruct the model. `nnx.split(obj, *filters)` returns a structure definition (`GraphDef`) followed by one `State` group per filter, where the catch-all filter `...` matches everything not yet matched by a previous filter (see the [Filters guide](https://flax.readthedocs.io/en/latest/guides/filters_guide.html) for the full filter language). `nnx.merge(graphdef, *states)` reconstructs a copy of the object from its definition and state groups. We will use these to select the differentiable parameters when passing them to `jax.grad`.
+
+The example below shows a complete training step using raw JAX transforms. `nnx.Optimizer` wraps an [Optax](https://optax.readthedocs.io/) optimizer and stores its internal state as Variables, providing a simple `update(model, grads)` method that performs in-place updates to both the optimizer state and model parameters:
+
+```{code-cell} ipython3
+import optax
+
+x, y = jnp.ones((3, 2)), jnp.ones((3, 5))
+model = Linear(2, 5, rngs=nnx.Rngs(0))
+optimizer = nnx.Optimizer(model, optax.adam(1e-3), wrt=nnx.Param)
+
+@jax.jit
+def train_step(model, optimizer, x, y):
+  # use same filter as Optimizer's `wrt`
+  graphdef, params, nondiff = nnx.split(model, nnx.Param, ...)
+
+  def loss_fn(params, nondiff):
+    nondiff = nnx.clone(nondiff) # refresh trace state
+    model = nnx.merge(graphdef, params, nondiff)
+    loss = jnp.mean((model(x) - y) ** 2)
+    return loss, nnx.state(model, Count)  # propagate state
+
+  grads, updates = jax.grad(loss_fn, has_aux=True)(params, nondiff)
+  nnx.update(model, updates)
+  optimizer.update(model, grads)
+
+  return nnx.state((model, optimizer))
+
+updates = train_step(model, optimizer, x, y)
+nnx.update((model, optimizer), updates)
+
+print(f'{model.count[...] = }')
+print(f'{optimizer.step[...] = }')
+```
+
+A few things to note. The state of the `model` and `optimizer` is extracted at once by packing them in a tuple (or any pytree), and `nnx.update` accepts the same structure. By default `jax.grad` differentiates with respect to the first positional argument only, `params` in our case. Finally, `nnx.clone` is needed because `jax.grad` passes non differentiable inputs (here `nondiff`) directly without tracing them, so we must manually clone them to refresh the trace state of their Variables - preventing tracer leakage. Omitting `nnx.clone` raises an error.
+
++++
+
+## NNX Transforms
+
+NNX transforms (`nnx.jit`, `nnx.grad`, ...) are thin wrappers over JAX transforms that provide the exact same APIs. Their main feature is **automatic state propagation**: the state of all input Variables is tracked and updated automatically behind the scenes. This removes the need for the `nnx.state/update` boilerplate and the use of `nnx.clone`:
+
+```{code-cell} ipython3
+x, y = jnp.ones((3, 2)), jnp.ones((3, 5))
+model = Linear(2, 5, rngs=nnx.Rngs(0))
+optimizer = nnx.Optimizer(model, optax.adam(1e-3), wrt=nnx.Param)
+
+@nnx.jit  # automatic state propagation
+def train_step(model, optimizer, x, y):
+  # use same filter as Optimizer's `wrt`
+  graphdef, params, nondiff = nnx.split(model, nnx.Param, ...)
+
+  def loss_fn(params, nondiff):
+    model = nnx.merge(graphdef, params, nondiff)
+    loss = jnp.mean((model(x) - y) ** 2)
+    return loss
+
+  grads = nnx.grad(loss_fn)(params, nondiff)
+  optimizer.update(model, grads)
+
+train_step(model, optimizer, x, y)
+
+print(f'{model.count[...] = }')
+print(f'{optimizer.step[...] = }')
+```
+
+Notice that `train_step` doesn't need to return anthing as `nnx.jit` propagates all Variable updates (model parameters, optimizer state, counts) automatically.
+
++++
+
+## Graph Mode
+
+Certain programs are easier to express by sharing references between objets on different parts of a structure, however this is not compatible with JAX's pytree model. If we create a simple model that shares a reference to the same Variable in two different attributes, NNX transforms and most other APIs will raise an error as sharing can result in inconsistencies:
+
+```{code-cell} ipython3
+@nnx.dataclass
+class Foo(nnx.Module):
+  a: nnx.Param
+  b: nnx.Param
+
+p = nnx.Param(jnp.array(1.0))
+model = Foo(p, p)  # shared Param
+
+@nnx.jit
+def forward(model, x):
+  model.a[...] += 1.0
+  return model.a * x + model.b
+
+try:
+  forward(model, jnp.array(1.0))
+except ValueError as e:
+  print(f'Error: {e}')
+```
+
+However, at the cost of some python overhead, `graph=True` can be passed to NNX APIs to enable **graph mode**. In graph mode, general graphs structures are allowed as long as they Variables are transformed consistently. We can fix the above example by enabling graph mode in `nnx.jit`:
+
+```{code-cell} ipython3
+@nnx.jit(graph=True)
+def forward(model, x):
+  model.a[...] += 1.0
+  return model.a * x + model.b
+
+y = forward(model, jnp.array(1.0))
+
+print(f'{y = !s}, {model.a[...] = !s}, {model.b[...] = !s}')
+```
+
+## Hijax (experimental)
+
+JAX's experimental **Hijax** API allows custom mutable types whose state updates propagate automatically through JAX transforms. When enabled via `nnx.var_default(hijax=True)`, plain JAX transforms like `jax.jit` handle state propagation of `Variable`s without any manual `nnx.state` / `nnx.update` calls. As a bonus, in hijax mode Variables can also be passed as captures, further simplifying the loss function:
+
+```{code-cell} ipython3
+with nnx.var_defaults(hijax=True): # enables Hijax Variables
+  x, y = jnp.ones((3, 2)), jnp.ones((3, 5))
+  model = Linear(2, 5, rngs=nnx.Rngs(0))
+  optimizer = nnx.Optimizer(model, optax.adam(1e-3), wrt=nnx.Param)
+
+print(model)  # display Hijax Variables
+
+@jax.jit  # automatic state propagation
+def train_step(model, optimizer, x, y):
+  # use same filter as Optimizer's `wrt`
+  graphdef, params, nondiff = nnx.split(model, nnx.Param, ...)
+
+  def loss_fn(params):
+    model = nnx.merge(graphdef, params, nondiff)
+    loss = jnp.mean((model(x) - y) ** 2)
+    return loss
+
+  grads = jax.grad(loss_fn)(nnx.vars_as(params, hijax=False))  # disable hijax for param grads
+  optimizer.update(model, grads)
+
+train_step(model, optimizer, x, y)
+
+print(f'{model.count[...] = }')
+print(f'{optimizer.step[...] = }')
+```
+
+As a temporary limitation, `jax.grad` does not yet handle mutable Hijax types. We work around this by converting `params` to regular Variables via `nnx.vars_as(params, hijax=False)` before passing them to `grad`. Hijax can also be enabled on a per-Variable basis by passing `hijax=True` to the constructor:
+
+```{code-cell} ipython3
+v = nnx.Variable(jnp.array(1), hijax=True)
+
+@jax.jit
+def inc(v):
+  v[...] += 1
+
+print(f'{v[...] = !s}')
+inc(v)
+print(f'{v[...] = !s}')
+```
diff --git a/flax/nnx/training/optimizer.py b/flax/nnx/training/optimizer.py
index 4004b02c0..37e2247af 100644
--- a/flax/nnx/training/optimizer.py
+++ b/flax/nnx/training/optimizer.py
@@ -25,7 +25,7 @@
 from flax.nnx.pytreelib import Pytree
 from flax.nnx.variablelib import Variable
 
-M = tp.TypeVar('M', bound=nnx.Module)
+M = tp.TypeVar('M')
 F = tp.TypeVar('F', bound=tp.Callable[..., tp.Any])
 
 class OptState(Variable):