o
     ¢im  ã                   @   sL   d Z ddlZdd„ Zej dg d¢¡dd„ ƒZej d	g d
¢¡dd„ ƒZdS )z9Test that longer and mixed texts are tokenized correctly.é    Nc                 C   s    d}| |ƒ}t |ƒdksJ ‚d S )Nu£  Una taula amb grans gerres de begudes i palles de coloraines com a reclam. Una carta
    cridanera amb ofertes de tapes, paelles i sangria. Un cambrer amb un somriure que convida a
    seure. La ubicaciÃ³ perfecta: el bell mig de la Rambla. PerÃ² Ã©s la una del migdia dâ€™un dimecres
    de tardor i no hi ha ningÃº assegut a la terrassa del local. El dia Ã©s rÃºfol, perÃ² no fa fred i
    a la majoria de terrasses de la Rambla hi ha poca gent. La immensa majoria dels clients -tret
    dâ€™alguna excepciÃ³ com al restaurant NÃºria- sÃ³n turistes. I la immensa majoria tenen entre mans
    una gerra de cervesa. Ens asseiem -fotÃ²graf i periodista- en una terrassa buida.é’   ©Úlen)Úca_tokenizerÚtextÚtokens© r   úQ/home/ubuntu/.local/lib/python3.10/site-packages/spacy/tests/lang/ca/test_text.pyÚ#test_ca_tokenizer_handles_long_text   s   r
   ztext,length))u   PerquÃ¨ va anar-hi?é   )zEl cotxe dels veins.é   )u   â€œAh no?â€r   )u(   SÃ­! "Anem", va contestar el Joan Carlesé   )u   Van cÃ³rrer aprox. 10kmr   )u   Llavors perquÃ©...é   )u   Vull parlar-te'n demÃ  al matÃ­é   )u!   Vull explicar-t'ho demÃ  al matÃ­r   c                 C   s   | |ƒ}t |ƒ|ksJ ‚d S )Nr   )r   r   Úlengthr   r   r   r	   Útest_ca_tokenizer_handles_cnts   s   r   z
text,match))Ú10T)Ú1T)z10,000T)z10,00T)z999.0T)ÚunT)ÚdosT)u   biliÃ³T)ÚgosF)ú,F)z1/2Tc                 C   s.   | |ƒ}t |ƒdksJ ‚|d j|ksJ ‚d S )Né   r   )r   Úlike_num)r   r   Úmatchr   r   r   r	   Útest_ca_lex_attrs_like_number%   s   r   )Ú__doc__Úpytestr
   ÚmarkÚparametrizer   r   r   r   r   r	   Ú<module>   s    þ
þ