{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {
    "colab_type": "text",
    "execution": {},
    "id": "view-in-github"
   },
   "source": [
    "<a href=\"https://colab.research.google.com/github/NeuromatchAcademy/course-content-dl/blob/main/projects/NaturalLanguageProcessing/machine_translation.ipynb\" target=\"_blank\"><img alt=\"Open In Colab\" src=\"https://colab.research.google.com/assets/colab-badge.svg\"/></a>   <a href=\"https://kaggle.com/kernels/welcome?src=https://raw.githubusercontent.com/NeuromatchAcademy/course-content-dl/main/projects/NaturalLanguageProcessing/machine_translation.ipynb\" target=\"_blank\"><img alt=\"Open in Kaggle\" src=\"https://kaggle.com/static/images/open-in-kaggle.svg\"/></a>"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "# Machine Translation\n",
    "\n",
    "**By Neuromatch Academy**\n",
    "\n",
    "__Content creators:__ Juan Manuel Rodriguez, Salomey Osei\n",
    "\n",
    "__Production editors:__ Amita Kapoor, Spiros Chavlis"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "---\n",
    "# Objective\n",
    "\n",
    "The main goal of this project is to train a sequence to sequence NN that transtlate a language into another language, e.g. french to english. This notebook is based on this [Pytorch tutorial](https://pytorch.org/tutorials/intermediate/seq2seq_translation_tutorial.html), but change several thing. "
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "---\n",
    "# Setup"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "# Imports\n",
    "import io\n",
    "import re\n",
    "import math\n",
    "import random\n",
    "import unicodedata\n",
    "\n",
    "import numpy as np\n",
    "import matplotlib.pyplot as plt\n",
    "\n",
    "import torch\n",
    "import torch.nn as nn\n",
    "import torch.nn.functional as F\n",
    "from torch import optim\n",
    "\n",
    "from tqdm.notebook import tqdm\n",
    "from sklearn.utils import shuffle\n",
    "\n",
    "device = torch.device(\"cuda\" if torch.cuda.is_available() else \"cpu\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "# Download the data\n",
    "import requests, zipfile\n",
    "\n",
    "zip_file_url = 'https://download.pytorch.org/tutorial/data.zip'\n",
    "r = requests.get(zip_file_url)\n",
    "z = zipfile.ZipFile(io.BytesIO(r.content))\n",
    "z.extractall()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Go.\tVa !\n",
      "Run!\tCours !\n",
      "Run!\tCourez !\n",
      "Wow!\tÇa alors !\n",
      "Fire!\tAu feu !\n",
      "Help!\tÀ l'aide !\n",
      "Jump.\tSaute.\n",
      "Stop!\tÇa suffit !\n",
      "Stop!\tStop !\n",
      "Stop!\tArrête-toi !\n"
     ]
    }
   ],
   "source": [
    "N = 10  # print the 10 first lines\n",
    "with open('data/eng-fra.txt') as f:\n",
    "  for i in range(N):\n",
    "    line = next(f).strip()\n",
    "    print(line)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "---\n",
    "# Representing the data\n",
    "\n",
    "We create a language representation defining indixes for each word. In addition to the words, our languages have three special tokens:\n",
    "\n",
    "* SOS: Start Of Sentence\n",
    "* EOS: End Of Sentence\n",
    "* PAD: Padding token used to fill inputs vectors where there are no other words."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "SOS_token = 0\n",
    "EOS_token = 1\n",
    "\n",
    "class Lang:\n",
    "  def __init__(self, name):\n",
    "    self.name = name\n",
    "    self.word2index = {}\n",
    "    self.word2count = {}\n",
    "    self.index2word = {0: \"SOS\", 1: \"EOS\", 2: \"PAD\"}\n",
    "    self.n_words = 3  # Count SOS and EOS and PAD\n",
    "\n",
    "  def addSentence(self, sentence):\n",
    "    for word in sentence.split(' '):\n",
    "      self.addWord(word)\n",
    "\n",
    "  def addWord(self, word):\n",
    "    if word not in self.word2index:\n",
    "      self.word2index[word] = self.n_words\n",
    "      self.word2count[word] = 1\n",
    "      self.index2word[self.n_words] = word\n",
    "      self.n_words += 1\n",
    "    else:\n",
    "      self.word2count[word] += 1\n",
    "\n",
    "\n",
    "def unicodeToAscii(s):\n",
    "  return ''.join(\n",
    "      c for c in unicodedata.normalize('NFD', s)\n",
    "      if unicodedata.category(c) != 'Mn'\n",
    "  )\n",
    "\n",
    "\n",
    "def normalizeString(s):\n",
    "  s = unicodeToAscii(s.lower().strip())\n",
    "  s = re.sub(r\"([.!?])\", r\" \\1\", s)\n",
    "  s = re.sub(r\"[^a-zA-Z.!?]+\", r\" \", s)\n",
    "  return s\n",
    "\n",
    "\n",
    "def readLangs(lang1, lang2, reverse=False):\n",
    "  print(\"Reading lines...\")\n",
    "\n",
    "  # Read the file and split into lines\n",
    "  lines = io.open('data/%s-%s.txt' % (lang1, lang2), encoding='utf-8').\\\n",
    "      read().strip().split('\\n')\n",
    "\n",
    "  # Split every line into pairs and normalize\n",
    "  pairs = [[normalizeString(s) for s in l.split('\\t')] for l in lines]\n",
    "\n",
    "  # Reverse pairs, make Lang instances\n",
    "  if reverse:\n",
    "      pairs = [list(reversed(p)) for p in pairs]\n",
    "      input_lang = Lang(lang2)\n",
    "      output_lang = Lang(lang1)\n",
    "  else:\n",
    "      input_lang = Lang(lang1)\n",
    "      output_lang = Lang(lang2)\n",
    "\n",
    "  return input_lang, output_lang, pairs"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "MAX_LENGTH = 10\n",
    "\n",
    "eng_prefixes = (\n",
    "    \"i am \", \"i m \",\n",
    "    \"he is\", \"he s \",\n",
    "    \"she is\", \"she s \",\n",
    "    \"you are\", \"you re \",\n",
    "    \"we are\", \"we re \",\n",
    "    \"they are\", \"they re \"\n",
    ")\n",
    "\n",
    "\n",
    "def filterPair(p):\n",
    "  return len(p[0].split(' ')) < MAX_LENGTH and \\\n",
    "      len(p[1].split(' ')) < MAX_LENGTH and \\\n",
    "      p[1].startswith(eng_prefixes)\n",
    "\n",
    "\n",
    "def filterPairs(pairs):\n",
    "  return [pair for pair in pairs if filterPair(pair)]"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Reading lines...\n",
      "Read 135842 sentence pairs\n",
      "Trimmed to 10599 sentence pairs\n",
      "Counting words...\n",
      "Counted words:\n",
      "fra 4346\n",
      "eng 2804\n",
      "['nous sommes sans emploi .', 'we re unemployed .']\n"
     ]
    }
   ],
   "source": [
    "def prepareData(lang1, lang2, reverse=False):\n",
    "  input_lang, output_lang, pairs = readLangs(lang1, lang2, reverse)\n",
    "  print(\"Read %s sentence pairs\" % len(pairs))\n",
    "  pairs = filterPairs(pairs)\n",
    "  print(\"Trimmed to %s sentence pairs\" % len(pairs))\n",
    "  print(\"Counting words...\")\n",
    "  for pair in pairs:\n",
    "    input_lang.addSentence(pair[0])\n",
    "    output_lang.addSentence(pair[1])\n",
    "  print(\"Counted words:\")\n",
    "  print(input_lang.name, input_lang.n_words)\n",
    "  print(output_lang.name, output_lang.n_words)\n",
    "  return input_lang, output_lang, pairs\n",
    "\n",
    "\n",
    "input_lang, output_lang, pairs = prepareData('eng', 'fra', True)\n",
    "print(random.choice(pairs))"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "## Language word distributions\n",
    "\n",
    "We can check which is the word distribution in our dataset."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "def plot_lang(lang, top_k=100):\n",
    "  words = list(lang.word2count.keys())\n",
    "  words.sort(key=lambda w: lang.word2count[w], reverse=True)\n",
    "  print(words[:top_k])\n",
    "  count_occurences = sum(lang.word2count.values())\n",
    "\n",
    "  accumulated = 0\n",
    "  counter = 0\n",
    "\n",
    "  while accumulated < count_occurences * 0.8:\n",
    "    accumulated += lang.word2count[words[counter]]\n",
    "    counter += 1\n",
    "\n",
    "  print(f\"The {counter * 100 / len(words)}% most common words \"\n",
    "        f\"account for the {accumulated * 100 / count_occurences}% of the occurrences\")\n",
    "  plt.bar(range(100), [lang.word2count[w] for w in words[:top_k]])\n",
    "  plt.show()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "['.', 'je', 'suis', 'est', 'vous', 'pas', 'de', 'il', 'nous', 'tu', 'etes', 'ne', 'es', 'en', 'a', 'n', 'un', 'sommes', 'elle', 'la', 'tres', 'c', 'que', 'le', 'sont', 'j', 'une', 'd', 'ai', 'pour', 'l', 'ils', 'plus', 'ce', 'des', 'me', 'vais', 'elles', 'moi', '!', 'mon', 'trop', 'train', 'fort', 'si', 'ici', 'du', 'toujours', 'toi', 'tout', 'tous', 'les', '?', 'vraiment', 'sur', 't', 'te', 'm', 'dans', 'avec', 'avoir', 'encore', 'qu', 'tom', 'votre', 'au', 'peur', 'y', 'desole', 'bien', 'ca', 'bon', 'fais', 'toutes', 'heureux', 'faire', 'etre', 'son', 'aussi', 'assez', 'lui', 'tellement', 'ma', 'mes', 'fatigue', 'par', 'et', 'fait', 'ton', 'se', 'juste', 'maintenant', 'grand', 'desolee', 'avons', 'allons', 'peu', 'deux', 'on', 'vieux']\n",
      "The 4.674188349067465% most common words account for the 80.0371543427945% of the occurrences\n"
     ]
    },
    {
     "data": {
      "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYMAAAD4CAYAAAAO9oqkAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAQaUlEQVR4nO3df4ydVZ3H8fdnqaBgpEUmDbbNTjc2GjRxYRuoYWMMdaHgxvIHGoyRxnS3fyyuaEzcsvtHsyoJJkaEZCVpaLUYA7KVLI11Jd2CMfsHlUEMApXtCGLbFDragkbjj+p3/7inu5c6A525M3Pbe9+v5OY+z3nO89zz5DT9zDnPuTOpKiRJw+3P+t0ASVL/GQaSJMNAkmQYSJIwDCRJwIJ+N2Cmzj///BodHe13MyTptPHoo4/+rKpGJjt22obB6OgoY2Nj/W6GJJ02kjw31TGniSRJhoEkyTCQJGEYSJIwDCRJGAaSJAwDSRKGgSQJw0CSxJCGwejGnYxu3NnvZkjSKWMow0CS9HKvGgZJtiY5nOSJrrLzkuxKsq+9L2rlSXJ7kvEkjye5uOucda3+viTrusr/KskP2zm3J8ls36Qk6ZWdzMjgK8CaE8o2AruragWwu+0DXAWsaK8NwB3QCQ9gE3ApcAmw6XiAtDp/33XeiZ8lSZpjrxoGVfVd4MgJxWuBbW17G3BNV/ld1fEwsDDJBcCVwK6qOlJVR4FdwJp27A1V9XBVFXBX17UkSfNkps8MFlfVobb9PLC4bS8B9nfVO9DKXqn8wCTlk0qyIclYkrGJiYkZNl2SdKKeHyC3n+hrFtpyMp+1uapWVtXKkZFJ/z6DJGkGZhoGL7QpHtr74VZ+EFjWVW9pK3ul8qWTlEuS5tFMw2AHcHxF0Drg/q7y69uqolXAS2066QHgiiSL2oPjK4AH2rFfJFnVVhFd33UtSdI8edU/e5nkbuDdwPlJDtBZFXQLcG+S9cBzwAda9W8BVwPjwK+BjwBU1ZEknwEeafU+XVXHH0r/A50VS68D/rO9JEnz6FXDoKo+OMWh1ZPULeCGKa6zFdg6SfkY8PZXa4ckae74DWRJkmEgSTIMJEkYBpIkDANJEoaBJAnDQJKEYSBJwjCQJGEYSJIwDCRJGAaSJAwDSRKGgSQJw0CShGEgScIwkCRhGEiSMAwkSRgGkiQMA0kShoEkCcNAkoRhIEnCMJAkYRhIkjAMJEkYBpIkDANJEoaBJAnDQJJEj2GQ5BNJnkzyRJK7k7w2yfIke5KMJ/l6kjNb3bPa/ng7Ptp1nZta+dNJruztliRJ0zXjMEiyBPgYsLKq3g6cAVwHfA64tareDBwF1rdT1gNHW/mtrR5JLmznvQ1YA3wpyRkzbZckafp6nSZaALwuyQLgbOAQcDmwvR3fBlzTtte2fdrx1UnSyu+pqt9W1bPAOHBJj+2SJE3DjMOgqg4Cnwd+SicEXgIeBV6sqmOt2gFgSdteAuxv5x5r9d/YXT7JOS+TZEOSsSRjExMTM226JOkEvUwTLaLzU/1y4E3AOXSmeeZMVW2uqpVVtXJkZGQuP0qShkov00TvAZ6tqomq+j1wH3AZsLBNGwEsBQ627YPAMoB2/Fzg593lk5wjSZoHvYTBT4FVSc5uc/+rgaeAh4BrW511wP1te0fbpx1/sKqqlV/XVhstB1YA3+uhXZKkaVrw6lUmV1V7kmwHvg8cAx4DNgM7gXuSfLaVbWmnbAG+mmQcOEJnBRFV9WSSe+kEyTHghqr6w0zbJUmavhmHAUBVbQI2nVD8DJOsBqqq3wDvn+I6NwM399IWSdLM+Q1kSZJhIEkyDCRJGAaSJAwDSRKGgSQJw0CShGEgScIwkCRhGEiSMAwkSRgGkiQMA0kShoEkCcNAkoRhIEnCMJAkYRhIkjAMJEkYBpIkDANJEoaBJAnDQJKEYSBJwjCQJGEYSJIwDCRJGAaSJAwDSRKGgSQJw0CShGEgSaLHMEiyMMn2JD9KsjfJO5Ocl2RXkn3tfVGrmyS3JxlP8niSi7uus67V35dkXa83JUmanl5HBrcB366qtwLvAPYCG4HdVbUC2N32Aa4CVrTXBuAOgCTnAZuAS4FLgE3HA0SSND9mHAZJzgXeBWwBqKrfVdWLwFpgW6u2Dbimba8F7qqOh4GFSS4ArgR2VdWRqjoK7ALWzLRdkqTp62VksByYAL6c5LEkdyY5B1hcVYdaneeBxW17CbC/6/wDrWyq8j+RZEOSsSRjExMTPTRdktStlzBYAFwM3FFVFwG/4v+nhACoqgKqh894maraXFUrq2rlyMjIbF1WkoZeL2FwADhQVXva/nY64fBCm/6hvR9uxw8Cy7rOX9rKpiqXJM2TGYdBVT0P7E/ylla0GngK2AEcXxG0Dri/be8Arm+rilYBL7XppAeAK5Isag+Or2hlkqR5sqDH8/8R+FqSM4FngI/QCZh7k6wHngM+0Op+C7gaGAd+3epSVUeSfAZ4pNX7dFUd6bFdkqRp6CkMquoHwMpJDq2epG4BN0xxna3A1l7aIkmaOb+BLEkyDCRJhoEkCcNAkoRhIEnCMJAkYRhIkjAMJEkYBpIkDANJEoaBJAnDQJKEYSBJwjCQJGEYSJIwDCRJGAaSJAwDSRKGgSQJw0CShGEgScIwkCRhGEiSMAwkSRgGkiQMA0kShoEkCcNAkoRhIEnCMJAkYRhIkpiFMEhyRpLHknyz7S9PsifJeJKvJzmzlZ/V9sfb8dGua9zUyp9OcmWvbZIkTc9sjAxuBPZ27X8OuLWq3gwcBda38vXA0VZ+a6tHkguB64C3AWuALyU5YxbaJUk6ST2FQZKlwHuBO9t+gMuB7a3KNuCatr227dOOr2711wL3VNVvq+pZYBy4pJd2SZKmp9eRwReBTwF/bPtvBF6sqmNt/wCwpG0vAfYDtOMvtfr/Vz7JOS+TZEOSsSRjExMTPTZdknTcjMMgyd8Ch6vq0Vlszyuqqs1VtbKqVo6MjMzXx0rSwFvQw7mXAe9LcjXwWuANwG3AwiQL2k//S4GDrf5BYBlwIMkC4Fzg513lx3WfI0maBzMeGVTVTVW1tKpG6TwAfrCqPgQ8BFzbqq0D7m/bO9o+7fiDVVWt/Lq22mg5sAL43kzbJUmavl5GBlP5J+CeJJ8FHgO2tPItwFeTjANH6AQIVfVkknuBp4BjwA1V9Yc5aJckaQqzEgZV9R3gO237GSZZDVRVvwHeP8X5NwM3z0ZbJEnT5zeQJUmGwejGnYxu3NnvZkhSXw19GEiSDANJEoaBJAnDQJKEYSBJwjCQJGEYSJIwDCRJGAaSJAwDSRKGgSQJw0CShGEgScIwkCRhGEiSMAwkSRgGkiQMA0kShoEkCcNAkoRhIEnCMHiZ0Y07Gd24s9/NkKR5ZxhIkgwDSZJhIEnCMJAkYRhIkjAMJEkYBpIkegiDJMuSPJTkqSRPJrmxlZ+XZFeSfe19UStPktuTjCd5PMnFXdda1+rvS7Ku99uSJE1HLyODY8Anq+pCYBVwQ5ILgY3A7qpaAexu+wBXASvaawNwB3TCA9gEXApcAmw6HiCSpPkx4zCoqkNV9f22/UtgL7AEWAtsa9W2Ade07bXAXdXxMLAwyQXAlcCuqjpSVUeBXcCambZLkjR9s/LMIMkocBGwB1hcVYfaoeeBxW17CbC/67QDrWyq8sk+Z0OSsSRjExMTs9F0SRKzEAZJXg98A/h4Vf2i+1hVFVC9fkbX9TZX1cqqWjkyMjJbl5WkoddTGCR5DZ0g+FpV3deKX2jTP7T3w638ILCs6/SlrWyqcknSPOllNVGALcDeqvpC16EdwPEVQeuA+7vKr2+rilYBL7XppAeAK5Isag+Or2hlkqR5sqCHcy8DPgz8MMkPWtk/A7cA9yZZDzwHfKAd+xZwNTAO/Br4CEBVHUnyGeCRVu/TVXWkh3bNiuO/yvont7z3ZduSNIhmHAZV9d9Apji8epL6BdwwxbW2Altn2hZJUm/8BrIkyTCQJBkG0+afxpQ0iAwDSZJhIEnqbWnp0OueLnLZqaTTmSMDSZJhIElymmjWOGUk6XTmyECSZBhIkpwmmhMn86U0p5IknUocGUiSDANJktNEfePqI0mnEkcGkiRHBqcCRwmS+s2RgSTJkcGpZqplqY4YJM0lRwanEf+wjqS5YhicprqDwZCQ1CvDQJJkGEiSDIOB45SRpJkwDAaYzxUknSzDYAgZDJJOZBgMualGD44qpOHil840Lf7qDGkwGQaasV5GCwaJdGoxDNQXJ/vX4I7XMzykueUzA502fI4hzR1HBjrtdY8e5nL7+L40iE6ZMEiyBrgNOAO4s6pu6XOTpD8x16ORuQ40w0xTOSXCIMkZwL8BfwMcAB5JsqOqnupvy6TBM93R0FybjwActHueC6fKM4NLgPGqeqaqfgfcA6ztc5skaWikqvrdBpJcC6ypqr9r+x8GLq2qj55QbwOwoe2+BXi6h489H/hZD+efjrzn4eA9D4eZ3POfV9XIZAdOiWmik1VVm4HNs3GtJGNVtXI2rnW68J6Hg/c8HGb7nk+VaaKDwLKu/aWtTJI0D06VMHgEWJFkeZIzgeuAHX1ukyQNjVNimqiqjiX5KPAAnaWlW6vqyTn+2FmZbjrNeM/DwXseDrN6z6fEA2RJUn+dKtNEkqQ+MgwkScMZBknWJHk6yXiSjf1uz2xLsizJQ0meSvJkkhtb+XlJdiXZ194X9butsy3JGUkeS/LNtr88yZ7W119vCxQGRpKFSbYn+VGSvUneOej9nOQT7d/1E0nuTvLaQeznJFuTHE7yRFfZpH2bjtvb/T+e5OLpft7QhUHXr764CrgQ+GCSC/vbqll3DPhkVV0IrAJuaPe4EdhdVSuA3W1/0NwI7O3a/xxwa1W9GTgKrO9Lq+bObcC3q+qtwDvo3PvA9nOSJcDHgJVV9XY6C06uYzD7+SvAmhPKpurbq4AV7bUBuGO6HzZ0YcAQ/OqLqjpUVd9v27+k8x/EEjr3ua1V2wZc058Wzo0kS4H3Ane2/QCXA9tblYG65yTnAu8CtgBU1e+q6kUGvJ/prIJ8XZIFwNnAIQawn6vqu8CRE4qn6tu1wF3V8TCwMMkF0/m8YQyDJcD+rv0DrWwgJRkFLgL2AIur6lA79DywuE/NmitfBD4F/LHtvxF4saqOtf1B6+vlwATw5TY1dmeScxjgfq6qg8DngZ/SCYGXgEcZ7H7uNlXf9vz/2jCGwdBI8nrgG8DHq+oX3ceqs6Z4YNYVJ/lb4HBVPdrvtsyjBcDFwB1VdRHwK06YEhrAfl5E56fg5cCbgHP406mUoTDbfTuMYTAUv/oiyWvoBMHXquq+VvzC8aFjez/cr/bNgcuA9yX5CZ2pv8vpzKcvbNMJMHh9fQA4UFV72v52OuEwyP38HuDZqpqoqt8D99Hp+0Hu525T9W3P/68NYxgM/K++aHPlW4C9VfWFrkM7gHVtex1w/3y3ba5U1U1VtbSqRun06YNV9SHgIeDaVm3Q7vl5YH+St7Si1cBTDHA/05keWpXk7Pbv/Pg9D2w/n2Cqvt0BXN9WFa0CXuqaTjo5VTV0L+Bq4H+AHwP/0u/2zMH9/TWd4ePjwA/a62o6c+i7gX3AfwHn9butc3T/7wa+2bb/AvgeMA78O3BWv9s3y/f6l8BY6+v/ABYNej8D/wr8CHgC+Cpw1iD2M3A3neciv6czClw/Vd8CobNK8sfAD+mstprW5/nrKCRJQzlNJEk6gWEgSTIMJEmGgSQJw0CShGEgScIwkCQB/wslKzo0kE6LnAAAAABJRU5ErkJggg==\n",
      "text/plain": [
       "<Figure size 432x288 with 1 Axes>"
      ]
     },
     "metadata": {
      "needs_background": "light",
      "tags": []
     },
     "output_type": "display_data"
    }
   ],
   "source": [
    "plot_lang(input_lang)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "['.', 'i', 're', 'you', 'm', 'he', 'not', 'is', 'a', 'to', 'we', 's', 'the', 'very', 'are', 'of', 'she', 'am', 'they', 'in', 'going', 'my', 'for', 'all', 'at', 'here', 'with', 'that', 'good', 'as', 'your', 't', 'me', 'too', 'this', 'sorry', 'on', 'glad', 'it', 'than', 'now', 'happy', 'about', '?', 'aren', 'so', 'tired', 'afraid', 'sure', 'right', 'an', 'his', 'out', 'really', 'one', 'busy', 'still', 'just', 'old', 'always', 'tom', 'looking', 'be', 'friend', 'no', 'her', 'ready', 'by', '!', 'and', 'teacher', 'from', 'getting', 'him', 'alone', 'being', 'home', 'up', 'have', 'go', 'doing', 'help', 'see', 'proud', 'man', 'married', 'kind', 'who', 'waiting', 'yet', 'young', 'person', 'done', 'late', 'friends', 'new', 'anymore', 'hungry', 'such', 'sick']\n",
      "The 4.85540878257765% most common words account for the 80.00500226665207% of the occurrences\n"
     ]
    },
    {
     "data": {
      "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYMAAAD4CAYAAAAO9oqkAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAQXklEQVR4nO3df4xdZZ3H8fdnqaBgpEUmDbbNTjc2mmriwjZQw8YY6kLBjeUPNBgjjelu/1hc0Zi4ZfePZlUSTIwIyUrS0GoxBmQrWRrrSroFY/YPKoMYBCrbEcS2KXS0pRqNP6rf/eM+3b3UGcrMnV+99/1KJvec73nOuc/J08xnznPOvU1VIUkabH821x2QJM09w0CSZBhIkgwDSRKGgSQJWDDXHZiqCy+8sIaHh+e6G5J0xnjsscd+VlVD4207Y8NgeHiYkZGRue6GJJ0xkjw/0TaniSRJhoEkyTCQJGEYSJIwDCRJGAaSJAwDSRKGgSQJw0CSxICGwfCmXQxv2jXX3ZCkeWMgw0CS9HKGgSTJMJAkvYowSLItyZEkT3bVLkiyO8n+9rqo1ZPkjiSjSZ5IcknXPutb+/1J1nfV/yrJD9s+dyTJdJ+kJOmVvZorg68Aa0+pbQL2VNUKYE9bB7gaWNF+NgJ3Qic8gM3AZcClwOaTAdLa/H3Xfqe+lyRphp02DKrqu8DRU8rrgO1teTtwbVf97up4BFiY5CLgKmB3VR2tqmPAbmBt2/aGqnqkqgq4u+tYkqRZMtV7Bour6nBbfgFY3JaXAAe62h1stVeqHxynPq4kG5OMJBkZGxubYtclSafq+QZy+4u+pqEvr+a9tlTVqqpaNTQ07v/cJkmagqmGwYttiof2eqTVDwHLutotbbVXqi8dpy5JmkVTDYOdwMkngtYDD3TVb2hPFa0GjrfppAeBK5MsajeOrwQebNt+kWR1e4rohq5jSZJmyYLTNUhyD/Bu4MIkB+k8FXQrcF+SDcDzwAda828B1wCjwK+BjwBU1dEknwEebe0+XVUnb0r/A50nll4H/Gf7kSTNotOGQVV9cIJNa8ZpW8CNExxnG7BtnPoI8PbT9UOSNHP8BLIkyTCQJBkGkiQMA0kShoEkCcNAkoRhIEnCMJAkYRhIkjAMJEkYBpIkDANJEoaBJAnDQJKEYSBJwjCQJGEYSJIwDCRJGAaSJAwDSRKGgSQJw0CShGEgScIwkCRhGEiSMAwkSRgGkiQMA0kShoEkCcNAkoRhIEmixzBI8okkTyV5Msk9SV6bZHmSvUlGk3w9ydmt7TltfbRtH+46zs2t/kySq3o7JUnSZE05DJIsAT4GrKqqtwNnAdcDnwNuq6o3A8eADW2XDcCxVr+ttSPJyrbf24C1wJeSnDXVfkmSJq/XaaIFwOuSLADOBQ4DVwA72vbtwLVteV1bp21fkyStfm9V/baqngNGgUt77JckaRKmHAZVdQj4PPBTOiFwHHgMeKmqTrRmB4ElbXkJcKDte6K1f2N3fZx9XibJxiQjSUbGxsam2nVJ0il6mSZaROev+uXAm4Dz6EzzzJiq2lJVq6pq1dDQ0Ey+lSQNlF6mid4DPFdVY1X1e+B+4HJgYZs2AlgKHGrLh4BlAG37+cDPu+vj7CNJmgW9hMFPgdVJzm1z/2uAp4GHgetam/XAA215Z1unbX+oqqrVr29PGy0HVgDf66FfkqRJWnD6JuOrqr1JdgDfB04AjwNbgF3AvUk+22pb2y5bga8mGQWO0nmCiKp6Ksl9dILkBHBjVf1hqv2SJE3elMMAoKo2A5tPKT/LOE8DVdVvgPdPcJxbgFt66Yskaer8BLIkyTCQJBkGkiQMA0kShoEkCcNAkoRhIEnCMJAkYRhIkjAMJEkYBpIkDANJEoaBJAnDQJKEYSBJwjCQJGEYSJIwDCRJGAaSJAwDSRKGgSQJw0CShGEgScIwkCRhGEiSMAwkSRgGkiQMA0kShoEkCcNAkoRhIEmixzBIsjDJjiQ/SrIvyTuTXJBkd5L97XVRa5skdyQZTfJEkku6jrO+td+fZH2vJyVJmpxerwxuB75dVW8F3gHsAzYBe6pqBbCnrQNcDaxoPxuBOwGSXABsBi4DLgU2nwwQSdLsmHIYJDkfeBewFaCqfldVLwHrgO2t2Xbg2ra8Dri7Oh4BFia5CLgK2F1VR6vqGLAbWDvVfkmSJq+XK4PlwBjw5SSPJ7kryXnA4qo63Nq8ACxuy0uAA137H2y1iep/IsnGJCNJRsbGxnrouiSpWy9hsAC4BLizqi4GfsX/TwkBUFUFVA/v8TJVtaWqVlXVqqGhoek6rCQNvF7C4CBwsKr2tvUddMLhxTb9Q3s90rYfApZ17b+01SaqS5JmyZTDoKpeAA4keUsrrQGeBnYCJ58IWg880JZ3Aje0p4pWA8fbdNKDwJVJFrUbx1e2miRplizocf9/BL6W5GzgWeAjdALmviQbgOeBD7S23wKuAUaBX7e2VNXRJJ8BHm3tPl1VR3vslyRpEnoKg6r6AbBqnE1rxmlbwI0THGcbsK2XvkiSps5PIEuSDANJkmEgScIwkCRhGEiSMAwkSRgGkiQMA0kShoEkCcNAkoRhIEnCMJAkYRhIkjAMJEkYBpIkDANJEoaBJAnDQJKEYSBJwjCQJGEYSJIwDCRJGAaSJAwDSRKGgSQJw0CShGEgScIwkCRhGDC8aRfDm3bNdTckaU4NfBhIkgwDSRLTEAZJzkryeJJvtvXlSfYmGU3y9SRnt/o5bX20bR/uOsbNrf5Mkqt67ZMkaXKm48rgJmBf1/rngNuq6s3AMWBDq28AjrX6ba0dSVYC1wNvA9YCX0py1jT0S5L0KvUUBkmWAu8F7mrrAa4AdrQm24Fr2/K6tk7bvqa1XwfcW1W/rarngFHg0l76JUmanF6vDL4IfAr4Y1t/I/BSVZ1o6weBJW15CXAAoG0/3tr/X32cfV4mycYkI0lGxsbGeuy6JOmkKYdBkr8FjlTVY9PYn1dUVVuqalVVrRoaGpqtt5Wkvregh30vB96X5BrgtcAbgNuBhUkWtL/+lwKHWvtDwDLgYJIFwPnAz7vqJ3XvI0maBVO+Mqiqm6tqaVUN07kB/FBVfQh4GLiuNVsPPNCWd7Z12vaHqqpa/fr2tNFyYAXwvan2S5I0eb1cGUzkn4B7k3wWeBzY2upbga8mGQWO0gkQquqpJPcBTwMngBur6g8z0C9J0gSmJQyq6jvAd9rys4zzNFBV/QZ4/wT73wLcMh19kSRNnp9AliQZBt380jpJg8owkCQZBpIkw2BC3VNGTh9J6neGgSTJMJAkGQaSJAwDSRKGgSQJw0CShGEgScIwkCRhGEiSMAwkSRgGkiQMA0kShoEkCcNAkoRhIEnCMJAkYRhIkjAMJEkYBpIkDANJEoaBJAnDQJKEYSBJwjCQJGEYSJIwDCRJ9BAGSZYleTjJ00meSnJTq1+QZHeS/e11UasnyR1JRpM8keSSrmOtb+33J1nf+2lJkiajlyuDE8Anq2olsBq4MclKYBOwp6pWAHvaOsDVwIr2sxG4EzrhAWwGLgMuBTafDBBJ0uyYchhU1eGq+n5b/iWwD1gCrAO2t2bbgWvb8jrg7up4BFiY5CLgKmB3VR2tqmPAbmDtVPslSZq8ablnkGQYuBjYCyyuqsNt0wvA4ra8BDjQtdvBVpuoPt77bEwykmRkbGxsOrouSWIawiDJ64FvAB+vql90b6uqAqrX9+g63paqWlVVq4aGhqbrsJI08HoKgySvoRMEX6uq+1v5xTb9Q3s90uqHgGVduy9ttYnqkqRZ0svTRAG2Avuq6gtdm3YCJ58IWg880FW/oT1VtBo43qaTHgSuTLKo3Ti+stUkSbNkQQ/7Xg58GPhhkh+02j8DtwL3JdkAPA98oG37FnANMAr8GvgIQFUdTfIZ4NHW7tNVdbSHfkmSJmnKYVBV/w1kgs1rxmlfwI0THGsbsG2qfZEk9cZPIEuSDANJkmEwacObdjG8addcd0OSppVhIEkyDCRJvT1aOvC6p4t+cut757AnktQbrwwkSYaBJMlpomkz0RNGTh9JOhMYBjPM+wqSzgROE0mSvDKYTV4lSJqvvDKQJBkGkiSnieaMU0aS5hOvDCRJhoEkyTCQJGEYSJLwBvK84M1kSXPNMJhnXuk7jk5uO3VZknrlNFEf8L/ilNQrw6DPGAySpsIwkCQZBpIkw6CvdU8ZOX0k6ZUYBpIkw2AQTXTF4NWDNLgMA0mSHzrT+Cb6gNtkrxz8UJx0ZjAMNKN6mXbyU9fS7Jk3YZBkLXA7cBZwV1XdOsdd0jx2uiuXmVieDa+2T9J0mxdhkOQs4N+AvwEOAo8m2VlVT89tz6T5aRADsJdlnd68CAPgUmC0qp4FSHIvsA4wDCT1rN8CcCakqmbkwJPqRHIdsLaq/q6tfxi4rKo+ekq7jcDGtvoW4Jke3vZC4Gc97H8m8pwHg+c8GKZyzn9eVUPjbZgvVwavSlVtAbZMx7GSjFTVquk41pnCcx4MnvNgmO5zni+fMzgELOtaX9pqkqRZMF/C4FFgRZLlSc4Grgd2znGfJGlgzItpoqo6keSjwIN0Hi3dVlVPzfDbTst00xnGcx4MnvNgmNZznhc3kCVJc2u+TBNJkuaQYSBJGswwSLI2yTNJRpNsmuv+TLcky5I8nOTpJE8luanVL0iyO8n+9rporvs63ZKcleTxJN9s68uT7G1j/fX2gELfSLIwyY4kP0qyL8k7+32ck3yi/bt+Msk9SV7bj+OcZFuSI0me7KqNO7bpuKOd/xNJLpns+w1cGHR99cXVwErgg0lWzm2vpt0J4JNVtRJYDdzYznETsKeqVgB72nq/uQnY17X+OeC2qnozcAzYMCe9mjm3A9+uqrcC76Bz7n07zkmWAB8DVlXV2+k8cHI9/TnOXwHWnlKbaGyvBla0n43AnZN9s4ELA7q++qKqfgec/OqLvlFVh6vq+235l3R+QSyhc57bW7PtwLVz08OZkWQp8F7grrYe4ApgR2vSV+ec5HzgXcBWgKr6XVW9RJ+PM52nIF+XZAFwLnCYPhznqvoucPSU8kRjuw64uzoeARYmuWgy7zeIYbAEONC1frDV+lKSYeBiYC+wuKoOt00vAIvnqFsz5YvAp4A/tvU3Ai9V1Ym23m9jvRwYA77cpsbuSnIefTzOVXUI+DzwUzohcBx4jP4e524TjW3Pv9cGMQwGRpLXA98APl5Vv+jeVp1nivvmueIkfwscqarH5rovs2gBcAlwZ1VdDPyKU6aE+nCcF9H5K3g58CbgPP50KmUgTPfYDmIYDMRXXyR5DZ0g+FpV3d/KL568dGyvR+aqfzPgcuB9SX5CZ+rvCjrz6QvbdAL031gfBA5W1d62voNOOPTzOL8HeK6qxqrq98D9dMa+n8e520Rj2/PvtUEMg77/6os2V74V2FdVX+jatBNY35bXAw/Mdt9mSlXdXFVLq2qYzpg+VFUfAh4GrmvN+u2cXwAOJHlLK62h87XvfTvOdKaHVic5t/07P3nOfTvOp5hobHcCN7SnilYDx7umk16dqhq4H+Aa4H+AHwP/Mtf9mYHz+2s6l49PAD9oP9fQmUPfA+wH/gu4YK77OkPn/27gm235L4DvAaPAvwPnzHX/pvlc/xIYaWP9H8Cifh9n4F+BHwFPAl8FzunHcQbuoXNf5Pd0rgI3TDS2QOg8Jflj4Id0nraa1Pv5dRSSpIGcJpIkncIwkCQZBpIkw0CShGEgScIwkCRhGEiSgP8F/wk1ru7dXY4AAAAASUVORK5CYII=\n",
      "text/plain": [
       "<Figure size 432x288 with 1 Axes>"
      ]
     },
     "metadata": {
      "needs_background": "light",
      "tags": []
     },
     "output_type": "display_data"
    }
   ],
   "source": [
    "plot_lang(output_lang)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "## The RNN\n",
    "\n",
    "Our goal is to create a network that takes an input sentence in one language and then provides the translation of the sentence in an output language.  Our network will use an RNN which will consist of an encoder, and a decoder. The encoder will first transform our input sentence into a vector, and pass this condensed vector into the decoder which will then translate the text in our given language. The process of this is further explained in the diagram below:\n",
    "\n",
    "<img src=\"https://raw.githubusercontent.com/NeuromatchAcademy/course-content-dl/main/projects/static/seq2seq.png\" width=\"600\" height=\"300\">\n",
    "\n",
    "**Note:** Please note that this same approach can be used for next sentence prediction task"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "class EncoderRNN(nn.Module):\n",
    "  def __init__(self, input_size, hidden_size):\n",
    "    super(EncoderRNN, self).__init__()\n",
    "    self.hidden_size = hidden_size\n",
    "\n",
    "    self.embedding = nn.Embedding(input_size, hidden_size)\n",
    "    self.gru = nn.GRU(hidden_size, hidden_size, batch_first=True)\n",
    "\n",
    "  def forward(self, input, hidden):\n",
    "    embedded = self.embedding(input)#.view(1, 1, -1)\n",
    "    output = embedded\n",
    "    output, hidden = self.gru(output, hidden)\n",
    "    return output, hidden\n",
    "\n",
    "  def initHidden(self, batch_size):\n",
    "    return torch.zeros(1, batch_size, self.hidden_size, device=device)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "class DecoderRNN(nn.Module):\n",
    "  def __init__(self, hidden_size, output_size):\n",
    "    super(DecoderRNN, self).__init__()\n",
    "    self.hidden_size = hidden_size\n",
    "\n",
    "    self.embedding = nn.Embedding(output_size, hidden_size)\n",
    "    self.gru = nn.GRU(hidden_size, hidden_size, batch_first=True)\n",
    "    self.out = nn.Linear(hidden_size, output_size)\n",
    "    self.softmax = nn.LogSoftmax(dim=-1)\n",
    "\n",
    "  def forward(self, input, hidden):\n",
    "    output = self.embedding(input)\n",
    "    output = F.relu(output)\n",
    "    output, hidden = self.gru(output, hidden)\n",
    "    output = self.softmax(self.out(output))\n",
    "    return output, hidden\n",
    "\n",
    "  def initHidden(self):\n",
    "    return torch.zeros(1, 1, self.hidden_size, device=device)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "---\n",
    "# Representing the text\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "def to_train(input_lang, output_lang, pairs, max_len=MAX_LENGTH+2):\n",
    "  x_input = []\n",
    "  x_output = []\n",
    "  target = []\n",
    "  for i, o in pairs:\n",
    "    s_i = [2] * max_len + [0] + [input_lang.word2index[w] for w in i.split(\" \")] + [1]\n",
    "    s_o = [0] + [output_lang.word2index[w] for w in o.split(\" \")] + [1] + [2] * max_len\n",
    "    s_to = s_o[1:] + [2]\n",
    "    x_input.append(s_i[-max_len:])\n",
    "    x_output.append(s_o[:max_len])\n",
    "    target.append(s_to[:max_len])\n",
    "  return x_input, x_output, target"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "x_input, x_partial, y = to_train(input_lang, output_lang, pairs)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Representation of an input sentece:\n",
      "[2, 2, 2, 2, 2, 2, 0, 3, 4, 5, 6, 1]\n",
      "PAD PAD PAD PAD PAD PAD SOS j ai ans . EOS\n",
      "\n",
      "Representation of an partial sentece:\n",
      "[0, 3, 4, 5, 1, 2, 2, 2, 2, 2, 2, 2]\n",
      "SOS i m . EOS PAD PAD PAD PAD PAD PAD PAD\n",
      "\n",
      "Representation of an target sentece:\n",
      "[3, 4, 5, 1, 2, 2, 2, 2, 2, 2, 2, 2]\n",
      "i m . EOS PAD PAD PAD PAD PAD PAD PAD PAD\n"
     ]
    }
   ],
   "source": [
    "print('Representation of an input sentece:')\n",
    "print(x_input[0])\n",
    "print(' '.join([input_lang.index2word[w] for w in x_input[0]]))\n",
    "print('\\nRepresentation of an partial sentece:')\n",
    "print(x_partial[0])\n",
    "print(' '.join([output_lang.index2word[w] for w in x_partial[0]]))\n",
    "print('\\nRepresentation of an target sentece:')\n",
    "print(y[0])\n",
    "print(' '.join([output_lang.index2word[w] for w in y[0]]))"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "We represent the input sentence using left padding because the GRU network process the sentence left to rignt, and we want that the output is as close to our sentence as possible. In contrast, we use right padding to the partial translation sentence because we want that our context is process inmediatly by our decoder. Finally, our target is our partial translation left-shifted.\n",
    "\n",
    "## Training\n",
    "Using this representation, we can train our model. Notice that our feed the full sentences as partial translations instanted of feeding partial sentences. This speed-ups our training, as next words in the sentence do not affects the output of the network and the gradients up to that point. "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "def predict(encoder, decoder, input, output):\n",
    "  _, hidden = encoder(input, encoder.initHidden(input.shape[0]))\n",
    "  out, _ = decoder(output, hidden)\n",
    "  return out\n",
    "\n",
    "def train(encoder, decoder, loss, input, output, target, learning_rate=0.001, epochs=10, batch_size=100):\n",
    "\n",
    "  plot_losses = []\n",
    "  plot_full_losses = []\n",
    "\n",
    "  encoder_optimizer = optim.SGD(encoder.parameters(), lr=learning_rate)\n",
    "  decoder_optimizer = optim.SGD(decoder.parameters(), lr=learning_rate)\n",
    "\n",
    "  for _ in tqdm(range(epochs)):\n",
    "    c_input, c_output, c_target = shuffle(input, output, target)\n",
    "    c_input = torch.tensor(c_input, dtype=torch.long, device=device)\n",
    "    c_output = torch.tensor(c_output, dtype=torch.long, device=device)\n",
    "    c_target = torch.tensor(c_target, dtype=torch.long, device=device)\n",
    "    acc_loss = 0\n",
    "    for i in range(0, c_target.shape[0], batch_size):\n",
    "      c_batch_size = c_target[i:i+batch_size, ...].shape[0]\n",
    "      encoder_optimizer.zero_grad()\n",
    "      decoder_optimizer.zero_grad()\n",
    "\n",
    "      out = predict(encoder, decoder, c_input[i:i+batch_size, ...], c_output[i:i+batch_size, ...])\n",
    "      #Reshapes the output and target to use the expected loss format.\n",
    "      # N x Classes for the output\n",
    "      # N for the targets\n",
    "      # Where N is the batch size\n",
    "      out = out.reshape(c_batch_size * c_input.shape[1], -1)\n",
    "      r_target = c_target[i:i+batch_size, ...].reshape(c_batch_size * c_input.shape[1])\n",
    "\n",
    "      c_loss = loss(out, r_target)\n",
    "      # Mask the errors for padding as they are not usefull!\n",
    "      valid = torch.where(r_target == 2, 0, 1)\n",
    "      c_loss = c_loss * valid\n",
    "      c_loss = torch.sum(c_loss) #/ torch.sum(valid)\n",
    "\n",
    "      c_loss.backward()\n",
    "\n",
    "      encoder_optimizer.step()\n",
    "      decoder_optimizer.step()\n",
    "      plot_full_losses.append(c_loss.detach().numpy())\n",
    "      acc_loss += c_loss.detach().numpy()\n",
    "    plot_losses.append(acc_loss /math.ceil(c_target.shape[0] / batch_size))\n",
    "  return plot_losses, plot_full_losses"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [
    {
     "data": {
      "application/vnd.jupyter.widget-view+json": {
       "model_id": "d4c45ca270a54e1685d015d6fa91e220",
       "version_major": 2,
       "version_minor": 0
      },
      "text/plain": [
       "HBox(children=(FloatProgress(value=0.0, max=10.0), HTML(value='')))"
      ]
     },
     "metadata": {
      "tags": []
     },
     "output_type": "display_data"
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "\n"
     ]
    }
   ],
   "source": [
    "hidden_size = 300\n",
    "num_epochs = 10  # Change this to 50 (original value!)\n",
    "encoder = EncoderRNN(input_lang.n_words, hidden_size).to(device)\n",
    "decoder = DecoderRNN(hidden_size, output_lang.n_words)\n",
    "epoch_error, batch_error = train(encoder, decoder,\n",
    "                                 nn.NLLLoss(reduction='none'),\n",
    "                                 x_input, x_partial, y,\n",
    "                                 epochs=num_epochs)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [
    {
     "data": {
      "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYsAAAEWCAYAAACXGLsWAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAgAElEQVR4nO3dd3xW5f3/8dcnIWGvsIQABmSLiIqIAi6GKFatq27qqPqz/Wqt1WqddaK1rmq17lH3qFpBARkOVKaCMoSAKDvsHbKu3x/n3HfOPZI7CblJSN7PxyMPzrnOdc59HW7Nh2ubcw4REZHSpFR1AUREpPpTsBARkYQULEREJCEFCxERSUjBQkREElKwEBGRhBQsRCqRmb1oZneXMe8yMxu6p88R2RsULEREJCEFCxERSUjBQmodv/nnejOba2Y7zOw5M2tjZh+b2TYz+9TMmgfyn2Jm88xss5lNMbOegWuHmNls/743gXpRn3WymX3n3/uVmfWpYJl/Z2bZZrbRzD40s3Z+upnZw2aWY2Zbzex7M+vtXzvJzOb7ZVtpZn+u0F+YCAoWUnudAQwDugG/Aj4G/gq0wvv/4moAM+sGvA780b82FvifmaWbWTrwPvAKkAG87T8X/95DgOeBK4AWwL+BD82sbnkKambHA/cBZwNtgZ+BN/zLw4Gj/fdo6ufZ4F97DrjCOdcY6A1MKs/nigQpWEht9U/n3Frn3ErgC2Cac+5b51wu8F/gED/fb4AxzrkJzrl84EGgPnAUMABIAx5xzuU7594BZgQ+43Lg3865ac65QufcS8Bu/77yOB943jk32zm3G7gJONLMsoB8oDHQAzDn3ALn3Gr/vnygl5k1cc5tcs7NLufnioQpWEhttTZwvCvOeSP/uB3ev+QBcM4VAcuBTP/aShe5GufPgeP9gev8JqjNZrYZ6ODfVx7RZdiOV3vIdM5NAh4HngByzOxpM2viZz0DOAn42cw+M7Mjy/m5ImEKFiKlW4X3Sx/w+gjwfuGvBFYDmX5aSMfA8XLgHudcs8BPA+fc63tYhoZ4zVorAZxzjznnDgN64TVHXe+nz3DOnQq0xmsue6ucnysSpmAhUrq3gJFmNsTM0oDr8JqSvgK+BgqAq80szcxOB/oH7n0GuNLMjvA7ohua2Ugza1zOMrwOXGxmff3+jnvxms2Wmdnh/vPTgB1ALlDk96mcb2ZN/eazrUDRHvw9SC2nYCFSCufcj8AFwD+B9Xid4b9yzuU55/KA04HfAhvx+jfeC9w7E/gdXjPRJiDbz1veMnwK3Aq8i1ebOQA4x7/cBC8obcJrqtoA/N2/diGwzMy2Alfi9X2IVIhp8yMREUlENQsREUlIwUJERBJSsBARkYQULEREJKE6VV2AZGjZsqXLysqq6mKIiOxTZs2atd451yretRoZLLKyspg5c2ZVF0NEZJ9iZj+XdE3NUCIikpCChYiIJKRgISIiCSlYiIhIQgoWIiKSkIKFiIgkpGAhIiIJKVgErN6yi4fG/8jSdduruigiItWKgkVAztbdPDYpm2UbdlR1UUREqhUFi4AUf3fMIu0nJiISQcEiILSTcqE2hBIRiaBgERCqWWj3QBGRSAoWAakpfjOUYoWISAQFiwA/VlCkmoWISAQFiwDzm6EKVbUQEYmgYBEQaoZSxUJEJJKCRYCaoURE4lOwCAjPs1CsEBGJoGAREJpnUaRoISISQcEioHjorIKFiEiQgkWAmqFEROJTsAjQch8iIvEpWASkarkPEZG4FCwCiledVbAQEQlSsAhQn4WISHwKFgHm/21oNJSISCQFi4BU09BZEZF4FCwC1AwlIhKfgkVAeOisooWISAQFi4DiVWcVLEREghQsAtQMJSISn4JFgJYoFxGJT8EiwDQpT0QkLgWLKKkppmYoEZEoSQ0WZrbMzL43s+/MbKaflmFmE8xssf9ncz/dzOwxM8s2s7lmdmjgOaP8/IvNbFQyy5xiaoYSEYm2N2oWxznn+jrn+vnnNwITnXNdgYn+OcCJQFf/53LgSfCCC3A7cATQH7g9FGCSwcy06qyISJSqaIY6FXjJP34JOC2Q/rLzfAM0M7O2wAnABOfcRufcJmACMCJZhUs1Q7FCRCRSsoOFA8ab2Swzu9xPa+OcW+0frwHa+MeZwPLAvSv8tJLSI5jZ5WY208xmrlu3rsIFTjF1cIuIRKuT5OcPcs6tNLPWwAQzWxi86JxzZlYpv5mdc08DTwP069evws9MMXVwi4hES2rNwjm30v8zB/gvXp/DWr95Cf/PHD/7SqBD4Pb2flpJ6Ulh6uAWEYmRtGBhZg3NrHHoGBgO/AB8CIRGNI0CPvCPPwQu8kdFDQC2+M1V44DhZtbc79ge7qclhTd0VsFCRCQomc1QbYD/+hPd6gCvOec+MbMZwFtmdinwM3C2n38scBKQDewELgZwzm00s7uAGX6+O51zG5NVaK8ZSsFCRCQoacHCObcUODhO+gZgSJx0B/y+hGc9Dzxf2WWMx8woLNobnyQisu/QDO4oqSladVZEJJqCRRQ1Q4mIxFKwiKKhsyIisRQsopgm5YmIxFCwiKKhsyIisRQsoqgZSkQkloJFFDO06qyISBQFiygpZho6KyISRcEiSqoZRZqUJyISQcEiihYSFBGJpWARRZPyRERiKVhE8YbOVnUpRESqFwWLKClqhhIRiaFgEcX8eRa5+YVk3TiGxyctruoiiYhUOQWLKKE9uLfuygfgpa9/ruISiYhUvWTvwb3Pmf3LZgDWbd9dxSUREak+VLMowdwVWwBQ94WIiIJFiVKsqksgIlJ9KFiUYPHa7YA3SU9EpLZTsCjBs1/+VNVFEBGpNhQsElCfhYiIgoWIiJSBgoWIiCSkYCEiIgkpWIiISEIKFiIikpCChYiIJKRgkZDGzoqIKFiIiEhCChYJab0PEREFiygPnNmnqosgIlLtKFhE6blfk6gU9VmIiCQ9WJhZqpl9a2Yf+eedzGyamWWb2Ztmlu6n1/XPs/3rWYFn3OSn/2hmJyS3vMl8uojIvmlv1CyuARYEzu8HHnbOdQE2AZf66ZcCm/z0h/18mFkv4BzgQGAE8C8zS01WYVO1kYWISIykBgszaw+MBJ71zw04HnjHz/IScJp/fKp/jn99iJ//VOAN59xu59xPQDbQP1llTompWih4iIgku2bxCHADUOSftwA2O+cK/PMVQKZ/nAksB/Cvb/Hzh9Pj3FPpUmP+RtRnISKStGBhZicDOc65Wcn6jKjPu9zMZprZzHXr1u3JcyqxVCIiNUMyaxYDgVPMbBnwBl7z06NAMzOr4+dpD6z0j1cCHQD8602BDcH0OPeEOeeeds71c871a9WqVYULHdsMJSIiSQsWzrmbnHPtnXNZeB3Uk5xz5wOTgTP9bKOAD/zjD/1z/OuTnHPOTz/HHy3VCegKTE9WuVMVLEREYtRJnKXS/QV4w8zuBr4FnvPTnwNeMbNsYCNegME5N8/M3gLmAwXA751zhckqnGKFiEisvRIsnHNTgCn+8VLijGZyzuUCZ5Vw/z3APckrYbEUDZ0VEYmhGdwiIpKQgoWIiCSkYBHF61MPnldRQUREqhEFCxERSUjBIgGNjhIRUbCI0bpxvYhzNUOJiChYxEivk8KlgzpVdTFERKoVBYs4glMtHLBh++4qK4uISHWgYBFHcH2ojTvyOOzuT/lh5ZYqLJGISNVSsIgj3sqzi9Zuq4KSiIhUDwoWccRb8aNIHd0iUospWMQRb5nyIg2LEpFaTMEijng1i+iZ3SIitYmCRRzx+izUDCUitZmCRRmpYiEitZmCRRx5hUUxaeqzEJHaTMEiDvVZiIhEKlOwMLNrzKyJeZ4zs9lmNjzZhasqDdJjNxBUn4WI1GZlrVlc4pzbCgwHmgMXAqOTVqoq1iA9NSatyDmm/7SRLTvzq6BEIiJVq6zBItQwcxLwinNuXiCtxhnWq01M2s68Qs7+99dc9vKMKiiRiEjVKmuwmGVm4/GCxTgzawzE9gLXEO2bN4hJKyj02qHmr9q6t4sjIlLlYhvn47sU6Assdc7tNLMM4OLkFav6KSyqsbFRRCShstYsjgR+dM5tNrMLgFuAWrUMa16herhFpPYqa7B4EthpZgcD1wFLgJeTVqpqKD/O3AsRkdqirMGiwHkTDU4FHnfOPQE0Tl6xqt7gri0jzhUsRKQ2K2uw2GZmN+ENmR1jZilAWvKKVfVevqQ/qYHZeflqhhKRWqysweI3wG68+RZrgPbA35NWqmrAzMhomB4+zytQzUJEaq8yBQs/QLwKNDWzk4Fc51yN77N48/IB4eN460WJiNQWZV3u42xgOnAWcDYwzczOTGbBqoPOrRqFj/MKCquwJCIiVaus8yxuBg53zuUAmFkr4FPgnWQVrLpRM5SI1GZl7bNICQUK34Zy3FsjhJqh4m2MJCJS05W1ZvGJmY0DXvfPfwOMTU6RqqdQzUJLlYtIbVSmYOGcu97MzgAG+klPO+f+m7xiVT+awS0itVmZm5Kcc+865/7k/yQMFGZWz8ymm9kcM5tnZn/z0zuZ2TQzyzazN80s3U+v659n+9ezAs+6yU//0cxOKP9r7jn1WYhIbVZqsDCzbWa2Nc7PNjNLtPzqbuB459zBeIsQjjCzAcD9wMPOuS7AJrxFCvH/3OSnP+znw8x6AecABwIjgH+ZWeyGE0mm0VAiUpuVGiycc42dc03i/DR2zjVJcK9zzm33T9P8HwccT/EoqpeA0/zjU/1z/OtDzOtNPhV4wzm32zn3E5AN9C/ne1bY7FuHAZrBLSK1W1JHNJlZqpl9B+QAE/AWINzsnCvws6wAMv3jTGA5gH99C9AimB7nnuBnXW5mM81s5rp16yrtHTIaptO6cd1wM5RGQ4lIbZTUYOGcK3TO9cVbHqQ/0COJn/W0c66fc65fq1atKvXZqSnGtlxtpyoitddemSvhnNsMTMbbF6OZmYVGYbUHVvrHK4EOAP71pnjzOcLpce7ZK1ZvyWVHntdnoaGzIlIbJS1YmFkrM2vmH9cHhgEL8IJGaKmQUcAH/vGH/jn+9Un+sugfAuf4o6U6AV3xlh6pEoVRwWJXXiEPjf9Ro6VEpEYr66S8imgLvOSPXEoB3nLOfWRm84E3zOxu4FvgOT//c8ArZpYNbMQbAYVzbp6ZvQXMBwqA3zvnqmxoUmFRZLD415Rs/jkpmxaN6jLqqKyqKZSISJIlLVg45+YCh8RJX0qc0UzOuVy8hQrjPese4J7KLmNFFEQFi51+85RqFiJSk9Wq9Z0qQ3SXRehcg6REpCZTsBARkYQULCpg1s+bwscOjY4SkZpPwaICznjyK6Zmr49I02Q9EanJFCwq6Pxnp5GzLTemD0NEpCZSsNgDu/OLR0CpXiEiNZmCxR4ItjypFUpEajIFizLo1qZR3PRgP4VihYjUZAoWZTDuj0eHj4OBo6jIhdeKUge3iNRkChZlEAwEbZvWDx9f/sostu0uiHeLiEiNomBRTul1iv/KFqzeynuzvQVwQ/Hk5w07yNmaC3gr1D45ZQlrtuTu9XKKiFQmBYtySk+N/CuLbn065u9T6H/vRAAW52zn/k8W8ofXZu+t4omIJIWCRTkFaxZQ3LEdb75FaIXabblqqhKRfZuCRTmlpUZWJVL8qkVhoLM7+lqRn+5cbB4RkX2BgkU5RS9RHmqGKnKO7SV0dofuOO+ZaXS6aWwSSycikhwKFuVkUTMqLFCz+HDOqnD6k1OWkF/ozfAO1Sa+XrphL5VSRKRyJXOnvBrlo/8bRItG6SxcvY13Z68Ip4c2PdqZV8h9Hy8Mp9//yUJytmUBaF1aEdnnKViUUe/MpkDkPIugn9bviEl7Yeoy7yAqWkz5MYdju7euzOKJiCSVmqEqyZJ120u8tis/csvw374wI9nFERGpVAoWlWTeqq0lXlu9JZd3Z60o8bqISHWnYFEBN4zoXu57rnt7TsT54rXbGDdvDZ8tWldZxRIRSRoFiwoY1KXlHj9j2MOfc8Ursxj1/PSYa7vyCnn68yXhSX0iIlVNwaICduUVJs5UDtN/2hhx/tCEH7l37EI+mruqhDtERPYuBYsKiO6wDjm2e6sKPe/sf38NwKyfNzJj2Ub+N2c1EH8JERGRqqBgUQGH7d+czq0aRqR1btWQFy/uX+Fnjpu3hjOe/JqznvqaNf6qtQ3SU/eonCIilUXBogIa10tj0nXH8tplRwAwoHMGk647FoDBXSvWn3HFK7Ni0uqmKViISPWgYLEHCv12otSU4iVAnrmoH/86/9Dw+cuXxK9tlKXWUFhUtIclFBGpHAoWe6C+/y//Nk3qhdPqpaWS2cyb5d07swlHd4vfj3Fi77ac1rddqc/fsiufFZt2xqSv2ryL4x+cwsrNuypadBGRclGw2AOH7d+cB87sw52n9o5IL8t23I3r1YlZM+r0QzMjzq99cw6D7p9MblSH+lszl7N0/Q7uGTOfV6f9XJGii4iUi4LFHjAzzu7XgUZ1y7/E1rVDuxE9jaJOSvwoM3915OzwzTvzARj7/Rpu/u8PFGk+hogkmYJFEkUvZ379Cd7M7yuPOYCmDdIiNkJ664ojw8d92jeNuO+BTxbyv8Dy5y9+tSzieklDeUVEKouCRRJEz4/49SGZtG9en8078wBo1iDNyxfI079TRvj4uKgVab9ZupH/e/3bEj9vR562bRWR5EpasDCzDmY22czmm9k8M7vGT88wswlmttj/s7mfbmb2mJllm9lcMzs08KxRfv7FZjYqWWWubKG+i4d/05cv/3I8G3d4zUcZDdMB+MsJPWhctw7/ufSIiPuit25N5PFJ2Qnz5BUUsaOEnfxERBJJZs2iALjOOdcLGAD83sx6ATcCE51zXYGJ/jnAiUBX/+dy4EnwggtwO3AE0B+4PRRgqqtWjesCcHTXyJFQnVo2AKBr60YAdGzRgO//dgKDouZmpKXG/1rmLN9MzrbcmPSXv/6ZXXmFbNmZz7uzVvDnt+fE9GNc+Nw0Drx9XMVeSERqvaRtfuScWw2s9o+3mdkCIBM4FTjWz/YSMAX4i5/+svMa8r8xs2Zm1tbPO8E5txHAzCYAI4DXk1X2PdWuWX2+uvH4iCG14PVVHN2tFX3aN4t7X6j5qk4JweLUJ6aW+JlD/jGFVVtyyWiYzsYdeazesotz+3fk5D7e8NxpUetPgbdhU35hEd3aNC7La4lILbZX+izMLAs4BJgGtPEDCcAaoI1/nAksD9y2wk8rKT36My43s5lmNnPduqpf9rtds/oRk/XACwIlBQqA+v5EvfoVmLm9aotX49i4w+sXmZq9gT+89m3MyrVvzSj+qzzuwSkMf/jzcn+WiNQ+SQ8WZtYIeBf4o3MuYgyoX4uolHGfzrmnnXP9nHP9WrWq2IJ+Ve264d254pjOMfMt4mntN3UlMm3phojzOz+aX6GyARQVOQ3TFamlkhoszCwNL1C86px7z09e6zcv4f+Z46evBDoEbm/vp5WUXuM0rZ/GTSf2pF5aKi9cfDgzbxlaYt6DMpuWeC0oege/7bsLOPK+iSxcU/LOfiFZN47hjg/nhc/Pe/Ybutw8tkyfKyI1SzJHQxnwHLDAOfdQ4NKHQGhE0yjgg0D6Rf6oqAHAFr+5ahww3Mya+x3bw/20Gu247q1p2agu7111FI3rxXYtldacFbQ9zgio1VtyGfHIFxFpXy1ZT15B7FpUwTkd3yzdGDORUERqh2TWLAYCFwLHm9l3/s9JwGhgmJktBob65wBjgaVANvAMcBWA37F9FzDD/7kz1NldGxzasTlHHdAiJn1Iz9Zxcscqy4S97JxtnPfMNO78aB65+YXk5hequUlEIiRzNNSXQEkTBobEye+A35fwrOeB5yuvdPuWywZ3Zty8tRFpB7ZrQpsmdVm7dXeJ99VJMXK25rLJ7/Quya48r0Yx5cd1/OebTzjrsPbc/evepd4jIrVL0oKFVJ7DszLo2bYJC1Zv5YEz+9AxowFmxjc3DeHNGcv5YvF6xny/Opz/tcuOYPYvm3hw/CLe/25VeKRUSUK1jxWbvFVs3561grdnrQhfX7R2W8TQ2/Hz1vDLxp1cNrgzACMf+4KhPdtw7bBulfbOIlK9KFjsI0LrSPVq24Tefue2mXFO/45s3JkXESz6ZWVwVJeWPDh+ERC7x3e0f05aXOr16OG1l/sbNYWCxbxVW5m3aitbduXTq20Tzj68Q8wzNu7I49C7JvCv8w9lUNeWNKmXFnF9zZZc9mtaL+Y+EaketDbUPuL+M/owuGvLuBPojujk9WncdGIPrj+hO+l14n+tVx17QPh4v8CEwS8Wr69wufILizvFX/xqGTe8O5ecrbn8sHJLRL7snO1eGV6dTZ87xpOztbi281X2egbcN5GPAwFPRKoXBYt9xMEdmvHKpUfEDQSH7d+cBXeO4IpjDuD3x3UJp48+/aCIfJcf3Tl8XJY9NxL54LuVdL3545j0G96dy8n//JK3ZxZPAIyeoHjhc9PDx6HhvbN+3lShcoybt4Yet37MrjytviuSLAoWNUT9ONu0ntO/I1cfXxw8mjVI5+NrBvPPcw+hoBJGO13zxndx06f86M2gv/6duWTdOIZ7xy6Iaer6ce228HEocFW0RPd/spDc/KK4uwoCLN8YP11Eyk7BooYbfuB+AHRu1RCAnm2b8KuD23FguyZ7rQxPf740HECCvlqynj++8S1bdnmr8UYv7b5h+24KixyPTVzMQxMWRVxbv303N733Pc9+sbTUz/5s0ToGPzBZTVwie0jBoobr4q9we/FRWRHpD551MGOuHsRQf77GaX3b8e2twzi4Q+Rkv+vKMcKpYZzaTWnOe2Ya73+3irdneiOvtuzKD08i3Jabz2F3f8p9Yxfw0IRFPDZxccQQ4BGPfMHr03/h7jELwmnxakvz/SauOSu2sGN3AVk3juG92Sti8olI6RQsarh6aaksGz2SC4/Mikhv2aguB7ZrygUD9gfg1L6ZNG+YzmuXHcGlgzpx2aBOAOQXORbeNYLF95zI7FuHlfpZb115ZKnXS9Lc39/j3dkr6H37OH77wnQOumM8AB8Edgh86rMlAExauJb124vnlyxdtwMgZq/yoF15BUzN9jryH5+czc68Auat2lJi/qCvsuPPbhepTRQsarlju7dm2l+HcFwPr4bRsG4dbj25F1cccwCHZzXnggEdqZeWSlpqChkN03nqgkNLfFb3Ci51viBqj/Fgk1WwaapBeh125RVyyYsz4z4nN7/kX+gvff1zeMjvttwCet02jpGPfcnuAm+2emGRY2tufjh/XkERd300n4kL1nLes9P4+7iFgc8pjNgStyzyC4vYWUU7Gq7avItTn5jKum0lT+AUSUTBQmL23QBvA6e3rzyK1o0jr43o3Tbi/JHf9OW5Uf2Y9tchEftwBIfp7pniX8oPf7qIg+8cX2LOP70V2eGeX1gUt0YQ/KV52F2fcsIjn3PPmAX0uWN8uHYy9vvVPPflT1z7pvfMn9Z7neRrtuTS49ZP+M83PwOwM6+AgsLEtY4Lnp1Gr9uqZkmzl75axpzlm3lnlprfpOIULKTcBvs7+334h4GcdkgmQ3q2CQec7+8Yzvd3DGdA59j1rCoiv9BF9IWU1hy0eksuV7/+LUvWbWfl5l10vfljHv50UYn5wVtocXHOdt6Z5Q3z3bG7gMIixx/9IBEKVel1vCFbXy3xmrI+9JvHet02jj+85u2PPur56Rz9wGR+WLmFBz5ZGFH7CM6Av/iF6Vzw7LSyvH6lqOfvj1KWdcJESqIZ3FJur0TtGR7U2J+ZPbBLS64Z0pVHJ0YOmX37yiN5Z+YK3py5PN7tHLZ/84j5FqGRUvE0TE9lR9Tcig/nrAr/Ii+PrbleE9Gu/ELqFxQ/s35aKttyC0j3a01/emsOAIax28/3ybw1gDfyCuDkf34JwB+HdgsHmaDJcUaGxZNXUMRlL8/k+uHdOah92Zakjyc0rLq0Ph2RRFSzkKRITTGuHdYtYvJfy0Z1ObRjc+4/sw+92sYfuvvk+SX3iUTr3yljT4sZY/LCnIi+j9AIq/e/W8XvXi7uK8krLKL7LZ+U+qz8OM1TJdWMduwuYPTHCyN+oS9au43PF63jmje/Ldc7RKvnT+RUsJA9oWAhSdUo3au8TrruGGbeMjQ8k7tOqvfnE+cVB4dHz+lL6yb16Ld/8zI9u2NGg0ouLdz6wTx2BPYA2RgYrjthfvHKv98t3xxx3+vTf4l5Vl5BEUVFLmJpkzOf+ip8vDtQg/n3Z0t46rMlvBHnOUvX7SDrxjGc+/Q3APy8YUfC9wg1ge0uKGSxv9TK7hIGAMxbtUWjvSQhBQtJqgZ1vSaQulH7it/+q150a9OI43oUb4F7ysHtALjInxMS2jq2T/umTP/rEJ6+8LCIZ7RtVh+AE3vvxyUDO1Vamb9fWbYhtUE3vfd9TFpuQSHH/WMK/e+dGE6bu6L42aFVfgGe+tybXLi7lF/aXy/dwFdL1nPM36cknCty8j+/5Ph/TOGyl2by6jQvABXGGcG1cvMuRj72JX/737yYay9/vYzXpsUGL6md1GchSXXmYe15YvKSmAl7h+2fwfhrjwFg4nXHMP2njZjfZjXyoLas27abunVSuOX9H+jWpjGtm9Rj+IH7sfTek1i+aSf/m7OKrBberPT8Qsdtv+rFrSf35N6xC3jmi58AaJCeys4KrBd11auz9+SVw/41eQk/byh5qZFx89bw26OyaJBeJ+Zf9hc8Oy1uf82iNd4yKd8t38zph7YnZ1sus5Zt4sSDikepOefC622F5qAAvDNrBUXO8dDZfcNpS9d5tY6Zy2LX5brtAy+AnHdEx4TvKjWfahaSVNcN6853tw2jWYP0EvMc0KoR5/Yv/oWUmmJcOqgTpx+aya8PyeSGE7qHr6WkGPu3aMgfju8aXtI8tJSJmXHzyF7hvFP+fCynHNyO0/q2i/i8SwftWS2kx35lm0+yLEFz0QOf/Eiv28YxcUFx89Y/xi9id0EhX2avj1vDueN/8wF4+euf+X7FFvrfM5H/9+pstgXmiGzdVfJ8jvdmF29fv3rLrvCCjsFaR3bOdn4pJcjFs3jtNrrd/LHW4arBFCwkqd7Zc1UAABUkSURBVFJSrNRAUZoG6XV4+DdeP0Y8fTs049XLjuDPw7vHvd66ST0eO/cQHjnnkIj030YtffLqZUdw28m9iPbCxYfHfe6hpfSpXDyw+NllXfr90pfK13Ee8qvHvwwfB/tW1mwtfbOrH9ds443pv7AkpziYZedsZ2deAdk52xn60Gcc/ffJce/NKygKL8ny7S+bmLHMGxL85ozl5BUW8ckPa8ITEEOTEF/5ehn3jJlfpneS6kvBQvZpA7u0LHH/jqBnL+oXPo5enn1gl5ZcMqgT0/46hFcu7R9O35Zb/C/0TL9/BEpfA+u47mXbG72yLVm3PdwxH6+zPeiERz7nxve+j+hgB/jdyzMZ+tBnpd573jPf0Pv2cTjn+PW/vuKsp77GOcezX/4UznPK41Ppddu48CTEWz+YF24aDJq7YnNE579UbwoWUuN8fv1xfHzN4Ii0ob3ahI+j99YIadOkHoO7tuKKY7x9Pzq3bMiEa49mzNWD+FNgQcUG6SV39dUtJXBF12gq0yUvzuTA28fxVfZ6XvxqWZnu2b47srlqavaGuPmcc+QVFLErr5CZ/hyYTjeNDV9//7uVEfmDy7fEGz4ccsrjUxkWtQtjRSxYvZWsG8cwd8XmxJmlwtTBLTVOxxbxh9SOvXow67fvpm3T+twysid3j1nAAX5/R9BNJ/bkqmO60LRB8davawL7mGc0LLlZLbjwbVaLBjxzUb/wL8Q/HN+FHvs15vPF6xj7/ZryvlaZXP/O3DLnLWk/kmjBwBDPtW/OCR8H+06888iA9PWSDdRPT6Wvv7rxll35TM1ez49rtnHhkfvT/ZaPGX1GH87uF7s1L8DW3HwKCl3EdzDOnxQ5ft5a+rSPXDU5O2cbq7fkMrhrK2TPKFhIrdErsIfHZYM7c8KB+9GsQVrcvE2j0gd2acmIA/ejecM0zjuiI9ty88N7nD97UT/mrdrKuu25HJ5V3J8xuGsrurZpzC0je3LP2AU0q5/GOf07ck7/jhxy53g27Yz8xZqWauQX7tmmVCs370qcKYkem5Qdcf7tL5GjrM59xpsrsmz0yHDa+f7SJ8N6taHIwUPjF8UNFvmFRfTxVyN+/XcDODCzCW9OX84jn3qrBKT5s+wLCovYmV9Ik3ppDH3o84jPW7FpJ5nN6odH3knZqRlKaq0OGQ3Cy5MkUi8tlacuPIz7Tu9DWmoKfzi+a7jvovt+jblmaFfuPu0g6qSmcNOJPWjRMJ0bRngd75cN7sxP942MWGjxo6sHx3xGaC/1aP846+CYtOsDI8Q6x6kdVRfBzvvFgd0R4y2+eOdHXid4vABeWOR4asqS8Pm5z3xDnzvGc8/Y4v1MQn+9d340nz53jI9oAisqcsxZvplB90/mjRnFS838smFneJmWaFk3jgn/jP54Ydw8Ibn5hTV+hryChUgF3XpyL1o3rkv75vUj0q845gBm3Tqs1EAU7DCfcfNQPvq/Qfz1pJ4Rebq2bsSiu0/kjMPak33Pifx5eDd+e1QWy0aPpFNLL0AM7dmakw+KXAkYoHG96tdoEFzUMTfO5MPQDPl123azu6CQ+8YuoO+d43ln1gr63DGOf0wofVHIB8cvIje/kA++89YG+0ugSW799t3hkVuh2s7khTkc/ffJjHp+esyzQptmhYT2Uoln4448etz6Cf3v+TScVlSBbYtXbt5FYZz7CgqLePTTxTF9THubgoVIBZ3TvyPTbx66x00arRrXpXdmU9pn1Kdhemq4RuItROj9L1rHr83cccqBQPG/vgd0bsGfooYO/+G4LmWeCwIwsEtkjebgDs147bIjOCiz4osXxrNsffEcjN63l7xc+4YdeVzxyiz+/flSNu/M589vz4lZMLIkPW79JDyZ8b1vizve+987MbyrYmgV3otfnBG+/rf/zQv3S63dmstJj31R6ufk5hfyt//NY8uufI57cApQvBjle7NX0PmvYyP6uRJZuzWXgaMn8eD4H2OufTR3NQ9/uoiHxpceLJOt+v3zQ6SWuP6E7hHrUDWpl8YPfzsBM+OqY7uUeu9RB7Tk3f93FId29Dp0v711GIfcNYHDs5pz3fBurN6Sy+0fzotYzwrg7H7teWtm5FIhFx/VKTwSauqNx5PRIJ366alcdewB/L9Kms0OMD9qk6vSxNuzvbLUS0uNqTm8MHUZ3yzdyLOj+vFB1OiueF6d9gsvTF1Gg/TUiJn2u/IKw81pKzbtZL+m9Xjuy5+Y/tMGDs/K4LLB3ki7lZt3hf+ef96wg+H+IIjJC3P4Tb8OFDrHkH98xumHZnJoR68fLLcgfsDclVdIds72PVqZuCxUsxCpIr8/rgs3jOgRkVaeWsph+zcP52/eMJ1lo0fy9pVHYWa0a1afZy7qx8xbhobzLxs9kvtO78MXNxwX0Q8Smgn/+HmHkNmsfnhJ8xG99+PBQL7emcUDBDpmNGDqjcfHLVfLRnXL/A4VUS8t9tfWvb8+qOz310lh2k+xw4QXrN7KwNGTmLs8/tpgXy/ZwOH3fEp2zjbu8gPCE5Mjm6d63vYJm/2BC6H9Q+76aD7j5q0N12yccwwcPYkr/uPt3HjqE1PDa4KlphjHPjiFIf/w5ru8N3tluGlq4oK1HP3AZAoKi1i4Zitjv18NwH0fL+BXj39Z7ln35aVgIVKDhX5xh5ZzT00xOmQ0CHeK99ivMb0zmzLntuGc3CdyWRQz48zD2tMgPZWm9dP46P8Gh4NM78wmZDarz19P6sEzgQmPQESAAq/vJahn2yaMjNPPElLSCLWQIT29OTMPnnVweCOu/ZqWPUA9Nimbv/2v5Bnl2f56WdHOfeYb1m3bHR5hlcio56ezK6r5bNXmXeEmtc8XraOwyIWDCxBe0ysotCfM2q27+WXjTnK27WbEI19w1auz2bIrP7zEysc/rOaHlVuSNtFRwUKkhlt670m88bsBEWmhiYmhP6OHCgd9e9swpt88BCie/Z7iH1x+9AEM69WGx8/zllSJ3qP90kGdmPCnY8Ln9dJS+PiawRFrgYUM6JzBn4Z147w41zpkeAMCRp9+EC39ORabd+ZR5K9pVSclhVtGFg8QuPPUA0t8n0Syc+IHi/Iqct7M+qCjRk/i5EB/yD1jFkTfFiO4lEv0+TlPf0NGQy9Q3vfxQk7+55elBsI9oT4LkRouJc6M9dBorAsG7J/w/rp1ipc3CQ3Wid546uQ+7WJqJuCNGAsa6w8ZHtS1JROvO4Z6aakMHD0JgDcuPxLw2vP/NSWyeafHfk346P8G06ReHdZu3U32uu2cfmj7cJ9MnRTjssGdOad/R3LzC2nZqG541dyqFNo1MWhZoLno+amxy6AkctZTX4ePF6zeGjFjHkoP/HtCNQuRWqhFo7osGz0y7r/wS3PKwe14blQ/LkwQZK4e0pX7zyjuRwgtlxIa8gveasOZzerz4sWHM+m64tpHZrP6PHBGn4jn3X1ab5rWT8PM2K9pPV69bAAZDdMDm2l5v8oa1a1T5j6TpvW9X6rBDbiKy1b+uSunHNyOL244jhtP7JE48x5ItJf6pqiaSGVRsBCRMkuvk8KQnm0SdsT/aVg3fnN4cSC6ekhXlo0eGfe+Y7u3pnOryH6NdoF5KFcc3Zk2Jaw8/MCZfbhkYCcOK2Ul4DZN4geP5v6/wIMBLGT/Fg355iav6W1w15Y8ef6hvHRJfw7KbEpGw3Teu+qomHuG9mpDh4wG/M4f8bQn3rnySK4Z0rVC95a2HteeUDOUiFQ7A7u04IEz+zC8VxualDK5sX3zBtz2q9jl5QFOOLAN4+at5Z0rj+LPb8/hgNaNOOHA/chsVp8urRtxrL8Me6gf5cRHi/sS/nHWwTRvmM6rlx3BYfs3D8/NOKZb/DWm6qelcsKBXsd7aorx9IWHcfkrs8r1zlcc3Zl/+zsmdm3dmH5ZGXy1ZD0z4mxMVZpk7E0PSQwWZvY8cDKQ45zr7adlAG8CWcAy4Gzn3Cbz/rnxKHASsBP4rXNutn/PKOAW/7F3O+deSlaZRaR6MLMSFxMsq0fPOYR123bTIaMBb15xZMz1k/u04/HJ2bRoVDditeAPfj+Q5n4n+sAuLRN+zuQ/H0tWiwYRtaYugRFgfdo3JTXF+PaXyFVxLxjQkf98U7ycfHA15FC/w12n9WbEI6VPEAz64objIlYHqEzJbIZ6ERgRlXYjMNE51xWY6J8DnAh09X8uB56EcHC5HTgC6A/cbmYl1zdFRHz10lLpkBF/BWLwmsrm3jGcpvXTwsFiWK82HNyhWYn3RBvasw2dWjaMaV7r3KpReHjw+Ud05L9XDYy599qh3RgeWDr/kkGdeO2yIyLmwLRuHL/5rSQdMhrEHdBQGZJWs3DOfW5mWVHJpwLH+scvAVOAv/jpLzvnHPCNmTUzs7Z+3gnOuY0AZjYBLwC9nqxyi0jtkJJi4SYuM+Prm46neTl2dVx094kl7o0CXmc7QKgLYeRBbenVrgm92jZh0sIcWjSqy9MX9SPrxjGANyemZZfI/pWMhum8cPHhXPzCDOK5/Ve9aFS3Dte/M7fCfRxltbf7LNo451b7x2uAUFjNBJYH8q3w00pKj2Fml+PVSujYURvMi0j5tG1avuabRDs0XnnsAcxZsTncl/HE+cWjro7rUfYdFY/r3ppHz+kbd/+RrJYNOa57a87awya7sqiyDm7nnDOzPVu8P/J5TwNPA/Tr16/SnisiUhGdWjbkkz8eXSnPOrVvJt3aNCavoIhTn5jKqX3bcXa/DmXqU6kseztYrDWzts651X4zU46fvhIIhsb2ftpKiputQulT9kI5RUSqlZ5tvbW5pt54PK0a1S3T3vOVaW/Ps/gQGOUfjwI+CKRfZJ4BwBa/uWocMNzMmvsd28P9NBGRGuGxcw/h5Uv6lzl/ZrP6ez1QQHKHzr6OVytoaWYr8EY1jQbeMrNLgZ+Bs/3sY/GGzWbjDZ29GMA5t9HM7gJCvTt3hjq7RURqglMOjl0mpToy52pe836/fv3czJkzE2cUEZEwM5vlnOsX75qW+xARkYQULEREJCEFCxERSUjBQkREElKwEBGRhBQsREQkIQULERFJqEbOszCzdXiT/iqqJbC+kopTXdWGd4Ta8Z56x5qjqt9zf+dc3B2eamSw2FNmNrOkiSk1RW14R6gd76l3rDmq83uqGUpERBJSsBARkYQULOJ7uqoLsBfUhneE2vGeeseao9q+p/osREQkIdUsREQkIQULERFJSMEiwMxGmNmPZpZtZjdWdXkqysw6mNlkM5tvZvPM7Bo/PcPMJpjZYv/P5n66mdlj/nvPNbNDS/+E6sXMUs3sWzP7yD/vZGbT/Pd508zS/fS6/nm2fz2rKstdVmbWzMzeMbOFZrbAzI6sid+lmV3r//f6g5m9bmb1asJ3aWbPm1mOmf0QSCv392dmo/z8i81sVLzPSiYFC5+ZpQJPACcCvYBzzaxX1ZaqwgqA65xzvYABwO/9d7kRmOic6wpM9M/Be+eu/s/lwJN7v8h75BpgQeD8fuBh51wXYBNwqZ9+KbDJT3/Yz7cveBT4xDnXAzgY711r1HdpZpnA1UA/51xvIBU4h5rxXb4IjIhKK9f3Z2YZeLuNHgH0B24PBZi9xjmnH6+T/0hgXOD8JuCmqi5XJb3bB8Aw4EegrZ/WFvjRP/43cG4gfzhfdf8B2uP9z3Y88BFgeDNg60R/r3j7tx/pH9fx81lVv0OC92sK/BRdzpr2XQKZwHIgw/9uPgJOqCnfJZAF/FDR7w84F/h3ID0i3974Uc2iWOg/1pAVfto+za+eHwJMA9o451b7l9YAbfzjffndHwFuAIr88xbAZudcgX8efJfwe/rXt/j5q7NOwDrgBb+p7Vkza0gN+y6dcyuBB4FfgNV4380satZ3GVTe76/Kv1cFixrMzBoB7wJ/dM5tDV5z3j9P9ulx02Z2MpDjnJtV1WVJojrAocCTzrlDgB0UN1kANea7bA6cihcc2wENiW26qZH2le9PwaLYSqBD4Ly9n7ZPMrM0vEDxqnPuPT95rZm19a+3BXL89H313QcCp5jZMuANvKaoR4FmZlbHzxN8l/B7+tebAhv2ZoErYAWwwjk3zT9/By941LTvcijwk3NunXMuH3gP7/utSd9lUHm/vyr/XhUsis0AuvqjL9LxOtc+rOIyVYiZGfAcsMA591Dg0odAaBTFKLy+jFD6Rf5IjAHAlkAVudpyzt3knGvvnMvC+74mOefOByYDZ/rZot8z9P5n+vmr9b/onHNrgOVm1t1PGgLMp4Z9l3jNTwPMrIH/32/oPWvMdxmlvN/fOGC4mTX3a2HD/bS9p6o7fqrTD3ASsAhYAtxc1eXZg/cYhFetnQt85/+chNemOxFYDHwKZPj5DW8k2BLge7wRKVX+HuV852OBj/zjzsB0IBt4G6jrp9fzz7P9652rutxlfLe+wEz/+3wfaF4Tv0vgb8BC4AfgFaBuTfgugdfx+mHy8WqKl1bk+wMu8d83G7h4b7+HlvsQEZGE1AwlIiIJKViIiEhCChYiIpKQgoWIiCSkYCEiIgkpWIhUgJmdYglWJjazdmb2jn/8WzN7vJyf8dcy5HnRzM5MlE9kTylYiFSAc+5D59zoBHlWOef25Bd5wmAhsrcoWIhEMbMsf++IF81skZm9amZDzWyqv5dA/2BNwc/3mJl9ZWZLQ//S95/zQ+DRHcxsiv+M2wOf976ZzfL3crjcTxsN1Dez78zsVT/tIn+Pgzlm9krguUdHf7ZIZauTOItIrdQFOAtv1uwM4Dy8mfGn4P2L//2o/G396z3wlmx4J84z+wO9gZ3ADDMb45ybCVzinNtoZvX99Hedczea2R+cc30BzOxA4BbgKOfcen9/g/J8tsgeUc1CJL6fnHPfO+eKgHl4G9U4vCUYsuLkf985V+Scm0/xctPRJjjnNjjnduEtlDfIT7/azOYA3+AtFtc1zr3HA28759YDOOc2lvOzRfaIahYi8e0OHBcFzouI//9NML+V8MzotXWcmR2Lt+Lqkc65nWY2BW/do4qWtaTPFtkjqlmI7D3D/L2X6wOnAVPxltbe5AeKHnjb4Ibk+0vNA0wCzjKzFhDeZlNkr1HNQmTvmY63x0h74D/OuZlm9j1wpZktwNtC85tA/qeBuWY22zl3vpndA3xmZoXAt8Bv927xpTbTqrMiIpKQmqFERCQhBQsREUlIwUJERBJSsBARkYQULEREJCEFCxERSUjBQkREEvr/qix3gsJIQkwAAAAASUVORK5CYII=\n",
      "text/plain": [
       "<Figure size 432x288 with 1 Axes>"
      ]
     },
     "metadata": {
      "needs_background": "light",
      "tags": []
     },
     "output_type": "display_data"
    },
    {
     "data": {
      "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYsAAAEWCAYAAACXGLsWAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAgAElEQVR4nO3deXxV9Z3/8dcnK0sgEEgwG4ZVWWS9IOiouBR3sS7RtlptZ8pYrdWOtVOnM+Nv2un8/HWzi0tLK9PaWhF3rFtBUauyBQSUTcOaBUhYAmHL+vn9cY8QKZAAuTlZ3s/H4z568z3nnvPhVnjnnO/5fr/m7oiIiBxLXNgFiIhI66ewEBGRRiksRESkUQoLERFplMJCREQapbAQEZFGKSxEmpmZ/d7M/ruJ+24ws4tO9jgisaawEBGRRiksRESkUQoL6ZCC2z/3mtlyM9trZo+ZWR8ze9XMKs1sjpn1bLD/VWa2wswqzOwtMxvSYNtoM1sSfO4poNNh57rCzJYGn33fzEacYM1fM7NCM9thZrPMLCtoNzN70MzKzGy3mX1oZsODbZeZ2cqgthIz+/YJfWHS4SkspCO7FvgcMBi4EngV+DcgnejfjW8CmNlg4Eng7mDbK8BLZpZkZknAC8AfgTTg6eC4BJ8dDUwH/hnoBfwGmGVmycdTqJldAPxfIB/IBDYCM4LNk4Fzgz9HarDP9mDbY8A/u3s3YDjw5vGcV+RTCgvpyH7l7lvdvQT4G7DA3T9w9wPA88DoYL8bgJfdfba71wA/AToDZwETgETg5+5e4+7PAIsanGMq8Bt3X+Dude7+B6Aq+Nzx+BIw3d2XuHsVcB8w0czygBqgG3A6YO6+yt03B5+rAYaaWXd33+nuS47zvCKAwkI6tq0N3u8/ws8pwfssor/JA+Du9UARkB1sK/HPzsi5scH7U4F7gltQFWZWAeQGnzseh9ewh+jVQ7a7vwk8BDwMlJnZNDPrHux6LXAZsNHM3jazicd5XhFAYSHSFKVE/9EHon0ERP/BLwE2A9lB26f6NnhfBPzQ3Xs0eHVx9ydPsoauRG9rlQC4+y/dfSwwlOjtqHuD9kXuPgXIIHq7bOZxnlcEUFiINMVM4HIzu9DMEoF7iN5Keh+YB9QC3zSzRDO7Bhjf4LO/BW4zszODjuiuZna5mXU7zhqeBL5iZqOC/o7/IXrbbIOZjQuOnwjsBQ4A9UGfypfMLDW4fbYbqD+J70E6MIWFSCPcfQ1wE/ArYBvRzvAr3b3a3auBa4BbgR1E+zeea/DZAuBrRG8T7QQKg32Pt4Y5wH8AzxK9mhkA3Bhs7k40lHYSvVW1HfhxsO1mYIOZ7QZuI9r3IXLcTIsfiYhIY3RlISIijVJYiIhIoxQWIiLSKIWFiIg0KiHsAmKhd+/enpeXF3YZIiJtyuLFi7e5e/qRtrXLsMjLy6OgoCDsMkRE2hQz23i0bboNJSIijVJYiIhIoxQWIiLSKIWFiIg0SmEhIiKNUliIiEijFBYiItIohUUDFfuqeXD2x6zesjvsUkREWhWFxWEefWstMxYWhV2GiEirorBooEeXJCYP68MLS0uoqq0LuxwRkVYjZmFhZrlmNtfMVprZCjO7q8G2O81sddD+owbt95lZoZmtMbOLG7RfErQVmtl3Y1UzQH4kl4p9NcxZWRbL04iItCmxnBuqFrjH3ZcE6w0vNrPZQB9gCjDS3avMLAPAzIYSXSZyGJAFzDGzwcGxHgY+BxQDi8xslruvjEXRZw/sTWZqJ2YWFHH5iMxYnEJEpM2J2ZWFu2929yXB+0pgFZANfB14wN2rgm2f/go/BZjh7lXuvp7oWsXjg1ehu68L1jueEewbE/FxxnVjc3jnk3JKK/bH6jQiIm1Ki/RZmFkeMBpYAAwGzjGzBWb2tpmNC3bLBhr2LBcHbUdrj5nrxubgDs8tKY7laURE2oyYh4WZpQDPAne7+26it77SgAnAvcBMM7NmOM9UMysws4Ly8vKTOtapvboyoX8aMwuKqa/3ky1NRKTNi2lYmFki0aB4wt2fC5qLgec8aiFQD/QGSoDcBh/PCdqO1v4Z7j7N3SPuHklPP+LaHcclP5LLph37WLhhx0kfS0SkrYvl01AGPAascvefNdj0AnB+sM9gIAnYBswCbjSzZDPrBwwCFgKLgEFm1s/Mkoh2gs+KVd2funR4JinJCcws0JgLEZFYXlmcDdwMXGBmS4PXZcB0oL+ZfUS0s/qW4CpjBTATWAm8Btzh7nXuXgt8A3idaCf5zGDfmOqcFM+VI7N49cMtVB6oifXpRERaNXNvf/fkI5GIN8eyqh9s2snnH3mfB645gxvH922GykREWi8zW+zukSNt0wjuYxiV24OBGSm6FSUiHZ7C4hjMjPxIDks2VVBYVhl2OSIioVFYNOLzo3OIjzOeLtCYCxHpuBQWjUjvlswFp2fw7JISaurqwy5HRCQUCosmyI/ksm1PFW+tObnBfiIibZXCogkmnZZO75RkdXSLSIelsGiCxPg4rh2TzdzVZZRXVoVdjohIi1NYNNH1kRxq650XPvi7mUZERNo9hUUTDczoxpi+PZhZUER7HMgoInIsCovjcH0kl0/K9rC0qCLsUkREWpTC4jhcMSKTTolxzNSYCxHpYBQWx6Fbp0QuOyOTl5aVsr+6LuxyRERajMLiOOVHctlTVcurH20OuxQRkRajsDhOZ/ZL49ReXTTmQkQ6FIXFcTIzrh+bw/x1O9i0fV/Y5YiItAiFxQm4dmwOZvDMYl1diEjHoLA4AZmpnTl3UDrPLC6mrl5jLkSk/YvlGty5ZjbXzFaa2Qozu+uw7feYmZtZ7+BnM7NfmlmhmS03szEN9r3FzD4JXrfEqubjkR/JpXTXAd4r3BZ2KSIiMRfLK4ta4B53HwpMAO4ws6EQDRJgMrCpwf6XAoOC11Tg0WDfNOB+4ExgPHC/mfWMYd1NctHQDHp0SVRHt4h0CDELC3ff7O5LgveVwCogO9j8IPAdoOE9nCnA4x41H+hhZpnAxcBsd9/h7juB2cAlsaq7qZIT4rl6VDZ/XbGVin3VYZcjIhJTLdJnYWZ5wGhggZlNAUrcfdlhu2UDDX9NLw7ajtYeuusjOVTX1fPi0tKwSxERiamYh4WZpQDPAncTvTX1b8B/xuA8U82swMwKystbZpGiYVmpDMvqrltRItLuxTQszCyRaFA84e7PAQOAfsAyM9sA5ABLzOwUoATIbfDxnKDtaO2f4e7T3D3i7pH09PRY/HGOKD+Sy4rS3awo3dVi5xQRaWmxfBrKgMeAVe7+MwB3/9DdM9w9z93ziN5SGuPuW4BZwJeDp6ImALvcfTPwOjDZzHoGHduTg7ZWYcqoLJLi43hakwuKSDsWyyuLs4GbgQvMbGnwuuwY+78CrAMKgd8CtwO4+w7gB8Ci4PX9oK1V6NElicnD+vDC0hKqajW5oIi0TwmxOrC7vwtYI/vkNXjvwB1H2W86ML0562tO+ZFc/rJ8M3NWlnH5iMywyxERaXYawd0Mzh7Ym6zUTuroFpF2S2HRDOLjjGvH5vDOJ+WUVuwPuxwRkWansGgm143NwR2eW6KObhFpfxQWzeTUXl2Z0D+NmQXF1GtyQRFpZxQWzSg/ksumHftYuKHVPKwlItIsFBbN6NLhmaQkJ2jMhYi0OwqLZtQ5KZ4rR2bxyoebqTxQE3Y5IiLNRmHRzPIjOeyvqePl5ZvDLkVEpNkoLJrZqNweDMpI0ZgLEWlXFBbNzMy4PpLDkk0VFJZVhl2OiEizUFjEwOdH5xAfZ+roFpF2Q2ERA+ndkrng9AyeXVJCTV192OWIiJw0hUWM5Edy2banirfWtMxCTCIisaSwiJFJp6XTOyWZp9XRLSLtgMIiRhLj47h2TDZvri6jvLIq7HJERE6KwiKGro/kUFvvvPDB360CKyLSpigsYmhgRjfG9O3BzIIioms7iYi0TQqLGMuP5PJJ2R6WFlWEXYqIyAmLWViYWa6ZzTWzlWa2wszuCtp/bGarzWy5mT1vZj0afOY+Mys0szVmdnGD9kuCtkIz+26sao6Fy0dk0ikxjpkacyEibVgsryxqgXvcfSgwAbjDzIYCs4Hh7j4C+Bi4DyDYdiMwDLgEeMTM4s0sHngYuBQYCnwh2LdN6NYpkcvOyOSlZaXsr64LuxwRkRMSs7Bw983uviR4XwmsArLd/a/uXhvsNh/ICd5PAWa4e5W7rwcKgfHBq9Dd17l7NTAj2LfNyI/ksqeqllc/0uSCItI2tUifhZnlAaOBBYdt+irwavA+G2g4KKE4aDta++HnmGpmBWZWUF7eugbCndkvjVN7ddH0HyLSZsU8LMwsBXgWuNvddzdo/x7RW1VPNMd53H2au0fcPZKent4ch2w2Zsb1Y3OYt247m7bvC7scEZHjFtOwMLNEokHxhLs/16D9VuAK4Et+6JnSEiC3wcdzgrajtbcp147NwQyeWawR3SLS9sTyaSgDHgNWufvPGrRfAnwHuMrdG/6aPQu40cySzawfMAhYCCwCBplZPzNLItoJPitWdcdKZmpnzh2UzjOLi6mr15gLEWlbYnllcTZwM3CBmS0NXpcBDwHdgNlB268B3H0FMBNYCbwG3OHudUFn+DeA14l2ks8M9m1z8iO5lO46wHuF28IuRUTkuCTE6sDu/i5gR9j0yjE+80Pgh0dof+VYn2srLhqaQY8uicwsKOLcwa2rX0VE5Fg0grsFJSfEc/WobP66YisV+6rDLkdEpMkUFi3s+kgO1XX1vLi0NOxSRESaTGHRwoZlpTIsqztP66koEWlDFBYhyI/k8lHJblaU7gq7FBGRJlFYhGDKqCyS4uM0oltE2gyFRQh6dEli8rA+vLC0hKpaTS4oIq2fwiIk+ZFcKvbVMGdlWdiliIg0SmERkrMH9iYrtRMzC9TRLSKtn8IiJPFxxnVjc3jnk3JKK/aHXY6IyDEpLEJ03dhc3OG5JeroFpHWTWERor69ujChfxpPLy7m0OS7IiKtj8IiZPmRXDZu38fC9TvCLkVE5KgUFiG7dHgmKckJzNSYCxFpxRQWIeucFM+VI7N45cPNVB6oCbscEZEjUli0AvmRHPbX1PHy8s1hlyIickQKi1ZgVG4PBmWkaMyFiLRaCotWwMzIj+SyZFMFhWWVYZcjIvJ3YrkGd66ZzTWzlWa2wszuCtrTzGy2mX0S/G/PoN3M7JdmVmhmy81sTINj3RLs/4mZ3RKrmsN09ehsEuJMkwuKSKsUyyuLWuAedx8KTADuMLOhwHeBN9x9EPBG8DPApcCg4DUVeBSi4QLcD5wJjAfu/zRg2pP0bsmcf3oGzy4poaauPuxyREQ+I2Zh4e6b3X1J8L4SWAVkA1OAPwS7/QG4Ong/BXjco+YDPcwsE7gYmO3uO9x9JzAbuCRWdYcpP5LLtj1VvL2mPOxSREQ+o0X6LMwsDxgNLAD6uPunj/1sAfoE77OBhj28xUHb0doPP8dUMysws4Ly8rb5j+2k09LpnZKsjm4RaXViHhZmlgI8C9zt7rsbbvPoHBfNMs+Fu09z94i7R9LT05vjkC0uMT6Oa8dk8+bqMsorq8IuR0TkoJiGhZklEg2KJ9z9uaB5a3B7ieB/P13QoQTIbfDxnKDtaO3t0vWRHGrrnRc+aLd/RBFpg2L5NJQBjwGr3P1nDTbNAj59oukW4MUG7V8OnoqaAOwKble9Dkw2s55Bx/bkoK1dGpjRjTF9ezCzoEiTC4pIqxHLK4uzgZuBC8xsafC6DHgA+JyZfQJcFPwM8AqwDigEfgvcDuDuO4AfAIuC1/eDtnYrP5LLJ2V7eHzexrBLEREBICFWB3b3dwE7yuYLj7C/A3cc5VjTgenNV13r9vkx2cxZtZX7Z62grPIA3558GtELNRGRcGgEdyuUnBDPr28ayxfG5/Lw3LXc+8xyjb0QkVDF7MpCTk5CfBz/8/kzOKV7Zx6c8zHllVU88qUxdE3W/2Ui0vJ0ZdGKmRl3XTSIB645g3cLt/GF385n2x49UisiLa9JYWFmd5lZ9+BJpcfMbImZTY51cRJ14/i+TLt5LB9vreTaR99nw7a9YZckIh1MU68svhoMqJsM9CT6lNMDx/6INKcLh/Thya9NoPJALdc++j5LiyrCLklEOpCmhsWnj+JcBvzR3Vdw9CedJEZG9+3JM7dNpEtyPF+YNp+5q8sa/5CISDNoalgsNrO/Eg2L182sG6DHc0LQPz2FZ79+FgMyuvJPjxdoHikRaRFNDYt/JDqV+Dh33wckAl+JWVVyTBndOjFj6kTOGtCL7zyznF+98YlGe4tITDU1LCYCa9y9wsxuAv4d2BW7sqQxKckJPHbLOK4Znc1PZ3/Mv7/wEXX1CgwRiY2mhsWjwD4zGwncA6wFHo9ZVdIkSQlx/DR/JLdPGsATCzZx258Ws7+6LuyyRKQdampY1AbTcUwBHnL3h4FusStLmsrM+M4lp/NfVw1jzqqtfOl389m5tzrsskSknWlqWFSa2X1EH5l92cziiPZbSCtxy1l5PPLFMXxUuptrf/0+RTv2hV2SiLQjTQ2LG4AqouMtthBdU+LHMatKTsilZ2Typ388k22VVVzz6PusKFW3kog0jyaFRRAQTwCpZnYFcMDd1WfRCo3vl8YzXz+LhDjjht/M573CbWGXJCLtQFOn+8gHFgLXA/nAAjO7LpaFyYkb3Kcbz91+Ftk9OnPr/y7kxaVadU9ETk5Tb0N9j+gYi1vc/cvAeOA/YleWnKzM1M7MvG0iY0/tyV0zljLtnbUaiyEiJ6ypYRHn7g3nlth+HJ+VkKR2TuQPXx3P5SMy+Z9XVvODv6yiXmMxROQENPUf/NfM7HUzu9XMbgVeJroM6lGZ2XQzKzOzjxq0jTKz+cESqwVmNj5oNzP7pZkVmtlyMxvT4DO3mNknweuWI51Lji45IZ5f3Tiar5ydx/T31nPnjA84UKOxGCJyfJq0ko6732tm1xJdVxtgmrs/38jHfg88xGcH7/0I+C93fzVYj/tHwCTgUmBQ8DqT6CDAM80sDbgfiABOdI6qWe6+syl1S1RcnPGfVwwlM7UT//PKarZVVjHtyxFSO+vpZxFpmibfSnL3Z939X4JXY0GBu78D7Di8GegevE8FSoP3U4DHPWo+0MPMMoGLgdnuviMIiNnAJU2tWQ4xM6aeO4Bf3DiKJZt2kv/reWzetT/sskSkjThmWJhZpZntPsKr0sx2n8D57gZ+bGZFwE+A+4L2bKDh9KnFQdvR2o9U69Tg1lZBeXn5CZTWMUwZlc3vvzKekor9XPPI+3y8tTLskkSkDThmWLh7N3fvfoRXN3fvfqzPHsXXgW+5ey7wLeCxEyn6KLVOc/eIu0fS09Ob67Dt0tkDe/PUP0+gtt657tH3Wbj+8AtAEZHPauknmm4BngveP030EVyAEiC3wX45QdvR2uUkDctK5bmvn0Xvbsnc9NgCXv1wc9gliUgr1tJhUQqcF7y/APgkeD8L+HLwVNQEYJe7bwZeByabWU8z60l0WdfXW7jmdis3rQvP3nYWw7O6c/ufl/CH9zeEXZKItFJNehrqRJjZk0SfdOptZsVEn2r6GvALM0sADgBTg91fIboKXyGwj2BhJXffYWY/ABYF+33f3XXPpBn17JrEE/80gTuf/ID7Z61gy+4DfOfi0zDTqrkicoi1x1G9kUjECwoKwi6jTamtq+c/Z63gzws2cc3obB64dgRJCRp3KdKRmNlid48caVvMriykbUmIj+OHVw8ns3snfjr7Y8r3VPHoTWNJSdZ/IiKiKTukATPjzgsH8aNrR/D+2u3c8Jt5lFUeCLssEWkFFBbyd/LH5fK7L0dYV76Xzz/8Pq99tEWTEIp0cAoLOaLzT89gxtQJdEmK57Y/LeaG38xneXFF2GWJSEgUFnJUI3N78Opd5/DfVw9nbfkernroPf7lqaWUVmiaEJGORk9DSZNUHqjhkbfW8ti76zFg6rn9ue28AXRVB7hIu3Gsp6F0ZSFN0q1TIv96yem88S/nMXnYKfzqzUIm/eQtnlq0iTqtkSHS7iks5LjkpnXhV18YzXO3n0Vuz87867Mfcvkv/8a7n2itb5H2TGEhJ2RM3548+/WzeOiLo9lTVctNjy3gq79fRGGZZrEVaY8UFnLCzIwrRmQx51/O47uXns6i9Tu4+Od/4z9f/Ijte6rCLk9EmpHCQk5ap8R4bjtvAG/dO4kvju/LEws2MenHb/Gbt9dSVaslXEXaA4WFNJteKcn84OrhvHbXOUTyevJ/X13NRT97m5eXb9agPpE2TmEhzW5Qn27871fG88d/HE/XpATu+PMSrvv1PD7YpKXTRdoqhYXEzDmD0nn5m+fwwDVnsHH7Pj7/yPt888kPKN65L+zSROQ4KSwkpuLjjBvH9+WteyfxjfMH8vqKLVzw07f50WurqTxQE3Z5ItJECgtpESnJCXz74tOY++1JXH5GJo+8tZbzf/IWTyzYSG1dfdjliUgjFBbSorJ6dObBG0bx4h1n0793Ct97/iMu++XfePvj8rBLE5FjiFlYmNl0Myszs48Oa7/TzFab2Qoz+1GD9vvMrNDM1pjZxQ3aLwnaCs3su7GqV1rWyNwePPXPE/j1TWM4UFPPLdMX8uXpC1mzRYP6RFqjmE0kaGbnAnuAx919eNB2PvA94HJ3rzKzDHcvM7OhwJPAeCALmAMMDg71MfA5oJjoWtxfcPeVxzq3JhJsW6pq6/jjvI384o1P2FtVy43j+/KtiwaT3i057NJEOpRQJhJ093eAHYc1fx14wN2rgn3KgvYpwAx3r3L39UAh0eAYDxS6+zp3rwZmBPtKO5KcEM8/ndOft+89ny9PzGPmoiLO/8lbPDy3kAM1GtQn0hq0dJ/FYOAcM1tgZm+b2bigPRsoarBfcdB2tPa/Y2ZTzazAzArKy3X/uy1K65rE/7lqGK9/61wm9O/Fj19fw4U/fZsXl5ZoUJ9IyFo6LBKANGACcC8w08ysOQ7s7tPcPeLukfT09OY4pIRkQHoKv7slwp+/diapnRO5a8ZSLv/lu/xx/kZ27dfjtiJhaOmwKAae86iFQD3QGygBchvslxO0Ha1dOoCzBvTmpTv/gR9fN4J6d/7jhY8Y/8M5fOuppcxbu11XGyItqKWXOXsBOB+Ya2aDgSRgGzAL+LOZ/YxoB/cgYCFgwCAz60c0JG4EvtjCNUuI4uOM6yO5XDc2h+XFu3iqoIiXlpby/AclnNqrC/nBtj7dO4Vdqki7FsunoZ4EJhG9ctgK3A/8EZgOjAKqgW+7+5vB/t8DvgrUAne7+6tB+2XAz4F4YLq7/7Cxc+tpqPZtf3Udr3y4macKili4fgdxBueflkH+uFwuOD2DxHgNHxI5Ecd6GkprcEubtn7bXmYWFPHM4mLKK6vonZLMtWOyyR+Xy4D0lLDLE2lTFBbS7tXW1fPWmnJmLCpi7poy6uqdcXk9yY/kcvmITLoktfQdV5G2R2EhHUrZ7gM8u6SEpwuKWLdtLynJCVw5MpP8SC6jcnvQTA/gibQ7CgvpkNydRRt28tSiIl75cDP7a+oY3CeFG8b15fOjs0nrmhR2iSKtisJCOrzKAzW8tCzaKb6sqILEeGPy0FPIH5fLPwzsTXycrjZEFBYiDazespunFhXx/AclVOyrIbtHZ64bm8P1kRxyenYJuzyR0CgsRI6gqraO2Su38tSiIt4t3AbAPwzsTX4kl8nD+pCcEB9yhSItS2Eh0ojinft4ZnExTxcUU1Kxnx5dErl6VDY3jMtlSGb3sMsTaREKC5Emqq933lu7jacWFfHXFVuprqtnZE4q+eNyuXJkFt07JYZdokjMKCxETsDOvdU8/0EJMwuKWL2lkk6JcVwy7BSmjMrmHwb11khxaXcUFiInwd0Pzkv18vLN7NpfQ88uiVx6RiZTRmYxLi+NOD1NJe2AwkKkmVTX1vO3T8p5cWkps1duZX9NHZmpnbhyZBZXjcxiWFZ3DfqTNkthIRID+6prmb1yKy8tK+Xtj8upqXP69+7KVaOiwdFfc1NJG6OwEImxin3VvPrRFmYtLWX++u24w/Ds7kwZmc0VIzPJTO0cdokijVJYiLSgLbsO8Jflpby0rJRlxbswg3F5aUwZlcVlwzPpqWlGpJVSWIiEZP22vby0rJQXl5awtnwvCXHGuYPTuWpkFp8b2oeuyZoNV1oPhYVIyNydlZt3M2tZKS8tLaV01wE6JcZx0ZA+XDUyi/NOS9eIcQmdwkKkFamvdxZv2smLS0t45cMt7NhbTfdOCVw6PJOrRmUxoX8vTWwooQglLMxsOnAFUObuww/bdg/wEyDd3bdZ9FnDXwCXAfuAW919SbDvLcC/Bx/9b3f/Q2PnVlhIW1FTV897hduYtbSU11dsYW91HendkrliRCZXjczS+hvSosIKi3OBPcDjDcPCzHKB3wGnA2ODsLgMuJNoWJwJ/MLdzzSzNKAAiAAOLA4+s/NY51ZYSFt0oKaON1aVMWtZCXNXl1NdV0/ftC5cNTKLq0ZlMbhPt7BLlHbuWGERs941d3/HzPKOsOlB4DvAiw3aphANFQfmm1kPM8sEJgGz3X0HgJnNBi4BnoxV3SJh6ZQYz+UjMrl8RCa79tfw+ootvLSslEfeKuShuYWcfko3rhqVxZUjsshN01Tq0rJa9FEMM5sClLj7ssMurbOBogY/FwdtR2s/0rGnAlMB+vbt24xVi7S81M6J5EdyyY/kUlZ5gFeWb+bFZaX86LU1/Oi1NYzISeXC0/tw4ZAMjRqXFtFiYWFmXYB/AybH4vjuPg2YBtHbULE4h0gYMrp14taz+3Hr2f0o2rGPl5ZHpxr5+Rsf8+Ccj8lK7cQFQzK4aEgfJg7opaeqJCZa8spiANAP+PSqIgdYYmbjgRIgt8G+OUFbCdFbUQ3b32qBWkVapdy0Ltw+aSC3TxpIeWUVc1eXMWfVVp5dXMKf5m+iS1I85w5K58IhGVxwega9UpLDLlnaiZg+Ohv0Wfzl8Kehgm0bgEjQwX058A0OdXD/0t3HBx3ci4ExwceWEO3g3nGs86qDWzqaAzV1zFu7ndmrtvLGqq1s3V2FGYzp25MLh2TwuSF9GJiRottVcpx2//4AAAvhSURBVExhPQ31JNGrgt7AVuB+d3+swfYNHAoLAx4i2nm9D/iKuxcE+32V6O0rgB+6+/82dm6FhXRk7s5HJbuZs2orb6zeykcluwHom9aFi4b04aIhGYzrl6b1OOTvaFCeSAe2edd+3lhVxhurtvLe2u1U19bTrVMCk07L4KIhGUwanEFqF60AKAoLEQnsrarl3cJtzFm5lTdXl7F9bzXxcca4vJ7BVUcf8np3DbtMCYnCQkT+Tl29s7SogjdWbeWNVWWs2VoJwMCMlIP9HKP79tTUIx2IwkJEGlW0Yx9zVm1lzqqtLFi3g9p6J61rEpNOS+dzQ/pwzuB0UjRLbrumsBCR47L7QA3vfFzOnJVbmbumnF37a0iKj2PCgF5cNCSDC4f0IbuHFnRqbxQWInLCauvqKdi4kzdWbWXOqjLWb9sLwOmndOOcQb2ZOKAX4/LS6NZJneRtncJCRJrN2vI9vLEq2kG+ZGMF1XX1xMcZZ2SnMnFALyb270UkryddknTLqq1RWIhITByoqWPxxp3MW7udeeu2s6yogtp6JzHeGJXbg4n9ezFhQC/G9O1Jp0RNQ9LaKSxEpEXsraqlYONO3l+7jflrt/NhyS7qHZIS4hjbt2f0ymNAL0bm9CApQYMCWxuFhYiEYveBGhat33HwymPl5t24Q+fEeCJ5PZnQvxdnDejFGdmpJGhEeegUFiLSKlTsq2b+uh3MX7edeWu3HxzbkZKcwLi84Mqjf2+GZnXX+I4QhLL4kYjI4Xp0SeKS4adwyfBTANi2p+pgcMxbt525a8oB6N4pgTP7RzvLJw7oxWl9uhGn8AiVwkJEQtM7JZkrRmRxxYgsALbuPhANjiA8Zq/cCkBa1yQm9E87GB4D0jWDbkvTbSgRabVKKvYzb+32gx3mpbsOAJDeLflgf8fE/r04tVcXhUczUJ+FiLR57s6mHfsOXnXMW7udssoqADJTOx18THdi/15ao/wEKSxEpN1xd9aW72Xeuu3MX7ud+eu2s31vNQA5PTsfvGU1cUAvMlM1NUlTKCxEpN1zdz7euod5a7cxb912FqzfQcW+GgDyenVh4oBeTAg6zTO6dwq52tZJYSEiHU59vbNqy27mBVcdC9bvoPJALQAD0rsefEz3zP5p9NZa5UB4y6pOB64Ayj5dg9vMfgxcCVQDa4kun1oRbLsP+EegDvimu78etF8C/AKIB37n7g80dm6FhYgcrq7eWVG662Cfx6L1O9hbXQfA4D4pwW2r3kzon0aPLkkhVxuOsMLiXGAP8HiDsJgMvOnutWb2/wDc/V/NbCjwJDAeyALmAIODQ30MfA4oBhYBX3D3lcc6t8JCRBpTU1fPhyW7Do7zKNiwk/01dZjB6ad0P9jnMb5fGqmdO8aMuqEMynP3d8ws77C2vzb4cT5wXfB+CjDD3auA9WZWSDQ4AArdfR2Amc0I9j1mWIiINCYxPo4xfXsypm9Pbp80kOraepYXVxy88nhiwUamv7eeOINhWYdm1B3XL61DLgIV5p/4q8BTwftsouHxqeKgDaDosPYzj3QwM5sKTAXo27dvsxYqIu1fUkIckbw0Inlp3HnhIA7U1LG06FB4/P69DUx7Z12HnY49lD+hmX0PqAWeaK5juvs0YBpEb0M113FFpGPqlBjPhP7RJ6i+BeyvrmPJpkPTsf/2nXU8+tZaEuONkTk9mNC/F2Pzolcq7fG2VYuHhZndSrTj+0I/1GFSAuQ22C0naOMY7SIiLaZzUjxnD+zN2QN7A4emY/80PB59ey11cx0zGJSRwthT0xh7ak/GntqTvHYwwrxFwyJ4suk7wHnuvq/BplnAn83sZ0Q7uAcBCwEDBplZP6IhcSPwxZasWUTkSLomJ3De4HTOG5wORMNjWXEFizfsZPGmnby8vJQnF24CoFfXJMac2pNIEB7Ds1Pb3GJQMQsLM3sSmAT0NrNi4H7gPiAZmB2k7Hx3v83dV5jZTKId17XAHe5eFxznG8DrRB+dne7uK2JVs4jIieqanMBZA3pz1oDolUd9vVNYvoeCDTtZvHEnizfuODgxYlJ8HMOzuxPJS2NM32iApHdr3WM9NChPRKSFbNtTxeKNO1mycScFG3fyYfEuquvqATi1VxfG9u3J2LxoeAzOaPlp2TWCW0SkFaqqreOjkl3BlUf0tW1PdH6rbp0SGN330K2rUbk96BrjR3a1+JGISCuUnBAfdISnAYdm1i0I+j0Wb9jJg3M+xh3iDIZkdidyas9o/0deGlmpnVqs41xXFiIirdiu/TV8sOnQraulRRXsC6YpOaV7p+htq6DfY2hWdxJPYi1zXVmIiLRRqZ0TmXRaBpNOywCgtq6e1VsqWRyEx5KNO3l5+WYAOiXGcdGQPjz0xTHNXofCQkSkDUmIj2N4dirDs1O55aw8ADbv2h8Njw076ZIUm0dyFRYiIm1cZmpnrhjR+eBa5rFw4je3RESkw1BYiIhIoxQWIiLSKIWFiIg0SmEhIiKNUliIiEijFBYiItIohYWIiDSqXc4NZWblwMaTOERvYFszldPW6bv4LH0fn6Xv45D28F2c6u7pR9rQLsPiZJlZwdEm0+po9F18lr6Pz9L3cUh7/y50G0pERBqlsBARkUYpLI5sWtgFtCL6Lj5L38dn6fs4pF1/F+qzEBGRRunKQkREGqWwEBGRRiksGjCzS8xsjZkVmtl3w64nTGaWa2ZzzWylma0ws7vCrilsZhZvZh+Y2V/CriVsZtbDzJ4xs9VmtsrMJoZdU5jM7FvB35OPzOxJM+sUdk3NTWERMLN44GHgUmAo8AUzGxpuVaGqBe5x96HABOCODv59ANwFrAq7iFbiF8Br7n46MJIO/L2YWTbwTSDi7sOBeODGcKtqfgqLQ8YDhe6+zt2rgRnAlJBrCo27b3b3JcH7SqL/GGSHW1V4zCwHuBz4Xdi1hM3MUoFzgccA3L3a3SvCrSp0CUBnM0sAugClIdfT7BQWh2QDRQ1+LqYD/+PYkJnlAaOBBeFWEqqfA98B6sMupBXoB5QD/xvclvudmXUNu6iwuHsJ8BNgE7AZ2OXufw23quansJBjMrMU4FngbnffHXY9YTCzK4Ayd18cdi2tRAIwBnjU3UcDe4EO28dnZj2J3oXoB2QBXc3spnCran4Ki0NKgNwGP+cEbR2WmSUSDYon3P25sOsJ0dnAVWa2gejtyQvM7E/hlhSqYqDY3T+90nyGaHh0VBcB69293N1rgOeAs0KuqdkpLA5ZBAwys35mlkS0g2pWyDWFxsyM6D3pVe7+s7DrCZO73+fuOe6eR/S/izfdvd395thU7r4FKDKz04KmC4GVIZYUtk3ABDPrEvy9uZB22OGfEHYBrYW715rZN4DXiT7NMN3dV4RcVpjOBm4GPjSzpUHbv7n7KyHWJK3HncATwS9W64CvhFxPaNx9gZk9Aywh+hThB7TDqT803YeIiDRKt6FERKRRCgsREWmUwkJERBqlsBARkUYpLEREpFEKC5FWxswmaWZbaW0UFiIi0iiFhcgJMrObzGyhmS01s98E613sMbMHg7UN3jCz9GDfUWY238yWm9nzwXxCmNlAM5tjZsvMbImZDQgOn9JgvYgngpHBIqFRWIicADMbAtwAnO3uo4A64EtAV6DA3YcBbwP3Bx95HPhXdx8BfNig/QngYXcfSXQ+oc1B+2jgbqJrq/QnOqJeJDSa7kPkxFwIjAUWBb/0dwbKiE5h/lSwz5+A54L1H3q4+9tB+x+Ap82sG5Dt7s8DuPsBgOB4C929OPh5KZAHvBv7P5bIkSksRE6MAX9w9/s+02j2H4ftd6Lz6VQ1eF+H/q5KyHQbSuTEvAFcZ2YZAGaWZmanEv07dV2wzxeBd919F7DTzM4J2m8G3g5WICw2s6uDYySbWZcW/VOINJF+WxE5Ae6+0sz+HfirmcUBNcAdRBcCGh9sKyParwFwC/DrIAwaztJ6M/AbM/t+cIzrW/CPIdJkmnVWpBmZ2R53Twm7DpHmpttQIiLSKF1ZiIhIo3RlISIijVJYiIhIoxQWIiLSKIWFiIg0SmEhIiKN+v9+J6wQ6saHlAAAAABJRU5ErkJggg==\n",
      "text/plain": [
       "<Figure size 432x288 with 1 Axes>"
      ]
     },
     "metadata": {
      "needs_background": "light",
      "tags": []
     },
     "output_type": "display_data"
    }
   ],
   "source": [
    "#print(epoch_error)\n",
    "#print(batch_error)\n",
    "\n",
    "plt.plot(batch_error)\n",
    "plt.title('model loss')\n",
    "plt.ylabel('loss')\n",
    "plt.xlabel('minibatch')\n",
    "plt.show()\n",
    "\n",
    "plt.plot(epoch_error)\n",
    "plt.title('model loss')\n",
    "plt.ylabel('loss')\n",
    "plt.xlabel('epoch')\n",
    "plt.show()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "---\n",
    "# Prediction and generation\n",
    "\n",
    "In the following cells, we can can see how our Seq2Seq model produces a prediction."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "p = predict(encoder, decoder, torch.tensor([x_input[40]],\n",
    "                                           dtype=torch.long,\n",
    "                                           device=device),\n",
    "            torch.tensor([x_partial[40]], dtype=torch.long, device=device))\n",
    "\n",
    "p = p.detach().numpy()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "[[  3   4 103   5   1   5   5   5   5   5   5   5]]\n",
      "[0, 3, 4, 32, 5, 1, 2, 2, 2, 2, 2, 2]\n"
     ]
    }
   ],
   "source": [
    "print(np.argmax(p, axis=-1))\n",
    "print(x_partial[40])"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "---\n",
    "# Generating a translation\n",
    "\n",
    "The generation is a very simple iterative process:\n",
    "\n",
    "1. Initialize the partiar translation using only the start of sentence token '\n",
    "SOS' (its id, which is 0).\n",
    "1. Repeat:\n",
    "    1. Predict the probability distribution for the next token given the partial translation.\n",
    "    1. Pick the most probable token. (other option is to sample the distribution).\n",
    "    1. Add that token to the translation.\n",
    "    1. If the token is EOF, break the loop.\n",
    "1. Return the partial translation, which is now a full translation.\n",
    "\n",
    "If we want to generate several candidates, we can use other generation algorithm. [Beam Search](https://www.youtube.com/watch?v=RLWuzLLSIgw) is a great option for this."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [],
   "source": [
    "def gen_translation(encoder, decoder, text, input_lang, output_lang,\n",
    "                    max_len=MAX_LENGTH+2):\n",
    "\n",
    "  text =  [2] * max_len + [0] + [input_lang.word2index[w] for w in text.split(\" \")] + [1]\n",
    "  text = torch.tensor([text[-max_len:]], dtype=torch.long, device=device)\n",
    "  out = [0] + [2] * max_len\n",
    "  out = [out[:max_len]]\n",
    "  for i in range(1, max_len):\n",
    "    pt_out =torch.tensor(out, dtype=torch.long, device=device)\n",
    "    p = predict(encoder, decoder, text, pt_out).detach().numpy()\n",
    "    out[0][i] = np.argmax(p, axis=-1)[0, i-1]\n",
    "    if np.argmax(p, axis=-1)[0, i-1] == 1:\n",
    "      break\n",
    "\n",
    "  return ' '.join([output_lang.index2word[idx] for idx in out[0]])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [
    {
     "data": {
      "application/vnd.google.colaboratory.intrinsic+json": {
       "type": "string"
      },
      "text/plain": [
       "'SOS i m in trouble . EOS PAD PAD PAD PAD PAD'"
      ]
     },
     "execution_count": 21,
     "metadata": {
      "tags": []
     },
     "output_type": "execute_result"
    }
   ],
   "source": [
    "gen_translation(encoder, decoder, pairs[40][0], input_lang, output_lang)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "> j ai ans .\n",
      "= i m .\n",
      "< SOS i m really . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je vais bien .\n",
      "= i m ok .\n",
      "< SOS i m going to go . EOS PAD PAD PAD PAD\n",
      "****************************************\n",
      "> ca va .\n",
      "= i m ok .\n",
      "< SOS i m going to go . EOS PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis gras .\n",
      "= i m fat .\n",
      "< SOS i m exhausted . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis gros .\n",
      "= i m fat .\n",
      "< SOS i m exhausted . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis en forme .\n",
      "= i m fit .\n",
      "< SOS i m in trouble . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis touche !\n",
      "= i m hit !\n",
      "< SOS i m so ! EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis touchee !\n",
      "= i m hit !\n",
      "< SOS i m so ! EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis malade .\n",
      "= i m ill .\n",
      "< SOS i m a teacher . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis triste .\n",
      "= i m sad .\n",
      "< SOS i m your friend . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis timide .\n",
      "= i m shy .\n",
      "< SOS i m exhausted . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis mouille .\n",
      "= i m wet .\n",
      "< SOS i m being . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis mouillee .\n",
      "= i m wet .\n",
      "< SOS i m your friend . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> il est mouille .\n",
      "= he s wet .\n",
      "< SOS he is a teacher . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis gras .\n",
      "= i am fat .\n",
      "< SOS i m exhausted . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis revenu .\n",
      "= i m back .\n",
      "< SOS i m being . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> me revoila .\n",
      "= i m back .\n",
      "< SOS i m being serious . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis chauve .\n",
      "= i m bald .\n",
      "< SOS i m still married . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis occupe .\n",
      "= i m busy .\n",
      "< SOS i m busy . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis occupee .\n",
      "= i m busy .\n",
      "< SOS i m busy . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis calme .\n",
      "= i m calm .\n",
      "< SOS i m exhausted . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> j ai froid .\n",
      "= i m cold .\n",
      "< SOS i m in trouble . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> j en ai fini .\n",
      "= i m done .\n",
      "< SOS i m done . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> tout va bien .\n",
      "= i m fine .\n",
      "< SOS i m all done . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je vais bien .\n",
      "= i m fine .\n",
      "< SOS i m going to go . EOS PAD PAD PAD PAD\n",
      "****************************************\n",
      "> ca va .\n",
      "= i m fine .\n",
      "< SOS i m going to go . EOS PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis libre !\n",
      "= i m free !\n",
      "< SOS i m so ! EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis libre .\n",
      "= i m free .\n",
      "< SOS i m in trouble . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis disponible .\n",
      "= i m free .\n",
      "< SOS i m a teacher . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis repu !\n",
      "= i m full .\n",
      "< SOS i m so ! EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis rassasie !\n",
      "= i m full .\n",
      "< SOS i m so ! EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis content .\n",
      "= i m glad .\n",
      "< SOS i m happy . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis chez moi .\n",
      "= i m home .\n",
      "< SOS i m just tired . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis en retard .\n",
      "= i m late .\n",
      "< SOS i m in trouble . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis paresseux .\n",
      "= i m lazy .\n",
      "< SOS i m in . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis faineant .\n",
      "= i m lazy .\n",
      "< SOS i m in . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis paresseuse .\n",
      "= i m lazy .\n",
      "< SOS i m a teacher . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je suis faineante .\n",
      "= i m lazy .\n",
      "< SOS i m exhausted . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je vais bien .\n",
      "= i m okay .\n",
      "< SOS i m going to go . EOS PAD PAD PAD PAD\n",
      "****************************************\n",
      "> je me porte bien .\n",
      "= i m okay .\n",
      "< SOS i m all hungry . EOS PAD PAD PAD PAD PAD\n",
      "****************************************\n"
     ]
    }
   ],
   "source": [
    "for i in range(40):\n",
    "  print('> {}'.format(pairs[i][0]))\n",
    "  print('= {}'.format(pairs[i][1]))\n",
    "  print('< {}'.format(gen_translation(encoder, decoder,\n",
    "                                      pairs[i][0],\n",
    "                                      input_lang,\n",
    "                                      output_lang)))\n",
    "  print('*' * 40)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {
    "execution": {}
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "> j ai ans .\n",
      "= i m .\n",
      "< SOS i m really . EOS PAD PAD PAD PAD PAD PAD\n",
      "****************************************\n",
      "> il est un des candidats aux presidentielles americaines .\n",
      "= he is one of the american presidential candidates .\n",
      "< SOS he is a good at the mood . EOS PAD PAD\n",
      "****************************************\n",
      "> ils collectent des dons pour l eglise .\n",
      "= they are collecting contributions for the church .\n",
      "< SOS they are in the same age . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> j ai quelques difficultes a compiler ce programme .\n",
      "= i m having some problems compiling this software .\n",
      "< SOS i m going to go out of this . EOS PAD\n",
      "****************************************\n",
      "> il entreprend des experiences dans son laboratoire .\n",
      "= he is carrying out experiments in his laboratory .\n",
      "< SOS he is afraid of his success . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> elle est non seulement belle mais aussi intelligente .\n",
      "= she is not only beautiful but also intelligent .\n",
      "< SOS she is not as smart as me . EOS PAD PAD\n",
      "****************************************\n",
      "> nous enquetons sur le meurtre de tom jackson .\n",
      "= we re investigating the murder of tom jackson .\n",
      "< SOS we re going to be late . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> elle est tres receptive a la suggestion hypnotique .\n",
      "= she s very susceptible to hypnotic suggestion .\n",
      "< SOS she is very good at the job . EOS PAD PAD\n",
      "****************************************\n",
      "> elle trouve toujours a redire aux autres .\n",
      "= she is always finding fault with other people .\n",
      "< SOS she is always complaining for her car . EOS PAD PAD\n",
      "****************************************\n",
      "> je pense apprendre le coreen le semestre prochain .\n",
      "= i m thinking of learning korean next semester .\n",
      "< SOS i m the one who trained me . EOS PAD PAD\n",
      "****************************************\n",
      "> tu es probablement trop jeune pour le comprendre .\n",
      "= you re probably too young to understand this .\n",
      "< SOS you re too old for this . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> vous etes probablement trop jeune pour le comprendre .\n",
      "= you re probably too young to understand this .\n",
      "< SOS you re too old for this . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> tu es trop critique des defauts des autres .\n",
      "= you are too critical of others shortcomings .\n",
      "< SOS you are too young to me . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> vous etes trop critique des defauts des autres .\n",
      "= you are too critical of others shortcomings .\n",
      "< SOS you are too young to me . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> nous attendons la publication de son ouvrage .\n",
      "= we are expecting the publication of his book .\n",
      "< SOS we are going to the same age . EOS PAD PAD\n",
      "****************************************\n",
      "> elle est forte pour inventer des histoires interessantes .\n",
      "= she is good at making up interesting stories .\n",
      "< SOS she is always complaining for her . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> elle trouve toujours des defauts a son mari .\n",
      "= she is always finding fault with her husband .\n",
      "< SOS she is always complaining of her car . EOS PAD PAD\n",
      "****************************************\n",
      "> je lui dis constamment de bien se comporter .\n",
      "= i m constantly telling her to behave herself .\n",
      "< SOS i m going to be your help . EOS PAD PAD\n",
      "****************************************\n",
      "> c est un interprete dans une banque internationale .\n",
      "= he s an interpreter in an international bank .\n",
      "< SOS he is a man of a teacher . EOS PAD PAD\n",
      "****************************************\n",
      "> il est expert en litterature francaise .\n",
      "= he is well acquainted with french literature .\n",
      "< SOS he is in his own . EOS PAD PAD PAD PAD\n",
      "****************************************\n",
      "> il bataille encore avec les croyances religieuses .\n",
      "= he is still grappling with religious beliefs .\n",
      "< SOS he is always complaining with me . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> il est competent en espagnol et en italien .\n",
      "= he is proficient in both spanish and italian .\n",
      "< SOS he is in love with his own . EOS PAD PAD\n",
      "****************************************\n",
      "> il quitte narita pour hawaii ce soir .\n",
      "= he is leaving narita for hawaii this evening .\n",
      "< SOS he is always complaining to go to go . EOS PAD\n",
      "****************************************\n",
      "> il s amuse en jouant aux jeux videos .\n",
      "= he is amusing himself by playing video games .\n",
      "< SOS he is always complaining of his success . EOS PAD PAD\n",
      "****************************************\n",
      "> il trouve toujours a redire aux autres .\n",
      "= he is always finding fault with other people .\n",
      "< SOS he is always complaining to go . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> nous discuterons du probleme demain .\n",
      "= we re going to discuss the problem tomorrow .\n",
      "< SOS we re going to be late . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> nous avons des problemes avec notre nouveau voisin .\n",
      "= we are having trouble with our new neighbor .\n",
      "< SOS we are going to be in trouble . EOS PAD PAD\n",
      "****************************************\n",
      "> il me tarde de recevoir votre reponse .\n",
      "= i m looking forward to receiving your reply .\n",
      "< SOS i m sure of you are . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> j ai hate de recevoir ta reponse .\n",
      "= i m looking forward to receiving your reply .\n",
      "< SOS i m sorry if i frightened you . EOS PAD PAD\n",
      "****************************************\n",
      "> je pense cloturer mon compte d epargne .\n",
      "= i am thinking of closing my savings account .\n",
      "< SOS i m sure of my father . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> je suis etonne par ton attitude irresponsable .\n",
      "= i am alarmed by your irresponsible attitude .\n",
      "< SOS i m your friend of your friend . EOS PAD PAD\n",
      "****************************************\n",
      "> je suis inquiet de votre attitude irresponsable .\n",
      "= i am alarmed by your irresponsible attitude .\n",
      "< SOS i m your friend of your friend . EOS PAD PAD\n",
      "****************************************\n",
      "> il est une autorite reconnue sur le sujet .\n",
      "= he is a recognized authority on the subject .\n",
      "< SOS he is a good at the mood . EOS PAD PAD\n",
      "****************************************\n",
      "> nous avons des invites ce soir .\n",
      "= we re having some guests over this evening .\n",
      "< SOS we re going to be in this . EOS PAD PAD\n",
      "****************************************\n",
      "> nous nous rejouissons de vous revoir .\n",
      "= we are looking forward to seeing you again .\n",
      "< SOS we re going to be your help . EOS PAD PAD\n",
      "****************************************\n",
      "> elles sont disposees a discuter du probleme .\n",
      "= they are willing to talk about the problem .\n",
      "< SOS they are all the same age . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> ils sont disposes a discuter du probleme .\n",
      "= they are willing to talk about the problem .\n",
      "< SOS they are about to the same . EOS PAD PAD PAD\n",
      "****************************************\n",
      "> ils parlent de ce qu ils vont chanter .\n",
      "= they are talking about what they will sing .\n",
      "< SOS they are going to be in the same age . EOS\n",
      "****************************************\n",
      "> je suis le porte parole de cette institution .\n",
      "= i m the spokesperson for this organization .\n",
      "< SOS i m the one who trained me . EOS PAD PAD\n",
      "****************************************\n",
      "> je suis le porte parole de cette organisation .\n",
      "= i m the spokesperson for this organization .\n",
      "< SOS i m the one who trained me . EOS PAD PAD\n",
      "****************************************\n"
     ]
    }
   ],
   "source": [
    "for i in range(40):\n",
    "  print('> {}'.format(pairs[-i][0]))\n",
    "  print('= {}'.format(pairs[-i][1]))\n",
    "  print('< {}'.format(gen_translation(encoder, decoder,\n",
    "                                      pairs[-i][0],\n",
    "                                      input_lang,\n",
    "                                      output_lang)))\n",
    "  print('*' * 40)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "---\n",
    "# To dos\n",
    "\n",
    "1. We use the full dataset to train/test. This is not a great idea, you should split the dataset into training/test.\n",
    "2. We did some empirical evaluation looking at the translated senteces. Other evaluation can be done using metrics like [BLUE](https://www.nltk.org/api/nltk.translate.html?highlight=bleu_score#module-nltk.translate.bleu_score) score.\n",
    "3. We try it with languages that are writting in a left-rigth as input and output. What happens if the languages are not written in this way? [Datasets](https://www.manythings.org/anki/) [Even more](https://tatoeba.org/en/downloads) \n",
    "4. It would be possible to do machine translation using other NN architectures, such as attention based model. \n",
    "5. We are not handling proper nouns, and that could be a problem.\n",
    "6. This can be applied to next sentence prediction."
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "execution": {}
   },
   "source": [
    "---\n",
    "# Further reading\n",
    "* [Sequence to Sequence Learning with Neural Networks](https://arxiv.org/abs/1409.3215)\n",
    "\n",
    "* [Neural machine translation by jointly learning to align and translate](https://arxiv.org/abs/1409.0473)\n",
    "\n",
    "* [Effective Approaches to Attention-based Neural Machine Translation](https://arxiv.org/abs/1508.04025)"
   ]
  }
 ],
 "metadata": {
  "colab": {
   "collapsed_sections": [],
   "include_colab_link": true,
   "name": "machine_translation",
   "provenance": [],
   "toc_visible": true
  },
  "kernel": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "kernelspec": {
   "display_name": "Python 3",
   "name": "python3"
  },
  "language_info": {
   "name": "python"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 0
}