o
    Ã¿i²˜  ã                
   @   sÎ  d Z ddlZddlZddlZddlZddlZddlmZmZ ddl	m
Z
 dejd< ddlmZmZmZmZmZ ddlmZ dd	lmZmZmZ dd
lmZmZmZmZmZmZ ddlm Z m!Z!m"Z" ddl#m$Z$ ddl%m&Z& ddl'm(Z(m)Z) ddl*m+Z+ z,ddl,m-Z- ddl.m/Z/ ddl0m1Z1 ddl2m3Z3 ddl4m5Z5 ddl6m7Z7 ddl8m9Z9 W n  e:yÇ Z; ze <de;› ¡ e <d¡ e=de;› ƒ‚dZ;[;ww de(dee> fdd„Z?eG dd„ de!ƒƒZ@G d d!„ d!e&ƒZAdS )"a   Google Cloud Speech-to-Text V2 service implementation for Pipecat.

This module provides a Google Cloud Speech-to-Text V2 service with streaming
support, enabling real-time speech recognition with features like automatic
punctuation, voice activity detection, and multi-language support.
é    N)Ú	dataclassÚfield)Ú
traced_sttÚfalseÚGRPC_ENABLE_FORK_SUPPORT)ÚAnyÚAsyncGeneratorÚListÚOptionalÚUnion)Úlogger)Ú	BaseModelÚFieldÚfield_validator)ÚCancelFrameÚEndFrameÚFrameÚInterimTranscriptionFrameÚ
StartFrameÚTranscriptionFrame)Ú	NOT_GIVENÚSTTSettingsÚ	_NotGiven)ÚGOOGLE_TTFS_P99)Ú
STTService)ÚLanguageÚresolve_language)Útime_now_iso8601)ÚClientOptions)ÚAborted)Údefault)ÚGoogleAuthError)Ú	speech_v2)Úcloud_speech)Úservice_accountzException: z‰In order to use Google AI, you need to `pip install pipecat-ai[google]`. Also, set `GOOGLE_APPLICATION_CREDENTIALS` environment variable.zMissing module: ÚlanguageÚreturnc                 C   sÌ  i t jd“t jd“t jd“t jd“t jd“t jd“t jd“t jd“t j	d“t j
d“t jd“t jd“t jd	“t jd
“t jd“t jd“t jd“i t jd“t jd“t jd“t jd“t jd“t jd“t jd“t jd“t jd“t jd“t jd“t jd“t jd“t jd“t j d“t j!d“t j"d“¥i t j#d“t j$d“t j%d“t j&d“t j'd“t j(d“t j)d“t j*d“t j+d“t j,d“t j-d“t j.d “t j/d “t j0d!“t j1d!“t j2d"“t j3d"“¥i t j4d#“t j5d$“t j6d#“t j7d%“t j8d&“t j9d'“t j:d(“t j;d)“t j<d*“t j=d+“t j>d,“t j?d-“t j@d.“t jAd/“t jBd0“t jCd1“t jDd2“¥i t jEd%“t jFd3“t jGd4“t jHd4“t jId5“t jJd5“t jKd6“t jLd6“t jMd7“t jNd8“t jOd9“t jPd:“t jQd7“t jRd;“t jSd;“t jTd<“t jUd<“¥i t jVd=“t jWd>“t jXd?“t jYd=“t jZd@“t j[d@“t j\dA“t j]dA“t j^dB“t j_dB“t j`dC“t jadC“t jbdD“t jcdD“t jddE“t jedE“t jfdF“¥i t jgdF“t jhdG“t jidG“t jjdH“t jkdI“t jldI“t jmdJ“t jndJ“t jodK“t jpdK“t jqdL“t jrdL“t jsdM“t jtdM“t judN“t jvdN“t jwdO“¥i t jxdO“t jydP“t jzdP“t j{dQ“t j|dQ“t j}dR“t j~dR“t jdS“t j€dS“t jdT“t j‚dT“t jƒdU“t j„dU“t j…dV“t j†dV“t j‡dW“t jˆdW“¥i t j‰dX“t jŠdX“t j‹dX“t jŒdY“t jdY“t jŽdZ“t jdZ“t jd[“t j‘d\“t j’d[“t j“d]“t j”d]“t j•d^“t j–d^“t j—d_“t j˜d_“t j™d`“¥i t jšd`“t j›da“t jœda“t jdb“t jždb“t jŸdc“t j dc“t j¡dd“t j¢de“t j£df“t j¤dg“t j¥dh“t j¦di“t j§dj“t j¨dk“t j©dd“t jªdl“¥i t j«dm“t j¬dn“t j­do“t j®dp“t j¯dq“t j°dr“t j±ds“t j²dt“t j³du“t j´dv“t jµdw“t j¶dx“t j·dx“t j¸dy“t j¹dz“t jºdy“t j»d{“¥i t j¼d{“t j½d|“t j¾d|“t j¿d}“t jÀd~“t jÁd“t jÂd€“t jÃd€“t jÄd“t jÅd“t jÆd‚“t jÇd‚“t jÈdƒ“t jÉdƒ“t jÊd„“t jËd„“t jÌd…“¥t jÍd†t jÎd†t jÏd‡t jÐd‡t jÑdˆt jÒd‰t jÓd‰i¥}tÔ| |dŠd‹S )ŒzÍMaps Language enum to Google Speech-to-Text V2 language codes.

    Args:
        language: Language enum value.

    Returns:
        Optional[str]: Google STT language code or None if not supported.
    zaf-ZAzsq-ALzam-ETzar-EGzar-AEzar-BHzar-DZzar-IQzar-JOzar-KWzar-LBzar-MAzar-OMzar-QAzar-SAzar-SYzar-TNzar-YEzhy-AMzaz-AZzeu-ESzbn-INzbn-BDzbs-BAzbg-BGzmy-MMzca-ESzcmn-Hans-CNzcmn-Hans-HKzcmn-Hant-TWzyue-Hant-HKzhr-HRzcs-CZzda-DKznl-NLznl-BEúen-USzen-AUzen-CAzen-GBzen-GHzen-HKzen-INzen-IEzen-KEzen-NGzen-NZzen-PHzen-SGzen-TZzen-ZAzet-EEzfil-PHzfi-FIzfr-FRzfr-BEzfr-CAzfr-CHzgl-ESzka-GEzde-DEzde-ATzde-CHzel-GRzgu-INziw-ILzhi-INzhu-HUzis-ISzid-IDzit-ITzit-CHzja-JPzjv-IDzkn-INzkk-KZzkm-KHzko-KRzlo-LAzlv-LVzlt-LTzmk-MKzms-MYzml-INzmr-INzmn-MNzne-NPzno-NOzfa-IRzpl-PLzpt-PTzpt-BRz
pa-Guru-INzro-ROzru-RUzsr-RSzsi-LKzsk-SKzsl-SIzes-ESzes-ARzes-BOzes-CLzes-COzes-CRzes-DOzes-ECzes-GTzes-HNzes-MXzes-NIzes-PAzes-PEzes-PRzes-PYzes-SVzes-USzes-UYzes-VEzsu-IDzsw-TZzsw-KEzsv-SEzta-INzta-MYzta-SGzta-LKzte-INzth-THztr-TRzuk-UAzur-INzur-PKzuz-UZzvi-VNzxh-ZAzzu-ZAF)Úuse_base_code)Õr   ÚAFÚAF_ZAÚSQÚSQ_ALÚAMÚAM_ETÚARÚAR_AEÚAR_BHÚAR_DZÚAR_EGÚAR_IQÚAR_JOÚAR_KWÚAR_LBÚAR_MAÚAR_OMÚAR_QAÚAR_SAÚAR_SYÚAR_TNÚAR_YEÚHYÚHY_AMÚAZÚAZ_AZÚEUÚEU_ESÚBNÚBN_BDÚBN_INÚBSÚBS_BAÚBGÚBG_BGÚMYÚMY_MMÚCAÚCA_ESÚZHÚZH_CNÚZH_HKÚZH_TWÚYUEÚYUE_CNÚHRÚHR_HRÚCSÚCS_CZÚDAÚDA_DKÚNLÚNL_BEÚNL_NLÚENÚEN_AUÚEN_CAÚEN_GBÚEN_GHÚEN_HKÚEN_INÚEN_IEÚEN_KEÚEN_NGÚEN_NZÚEN_PHÚEN_SGÚEN_TZÚEN_USÚEN_ZAÚETÚET_EEÚFILÚFIL_PHÚFIÚFI_FIÚFRÚFR_BEÚFR_CAÚFR_CHÚFR_FRÚGLÚGL_ESÚKAÚKA_GEÚDEÚDE_ATÚDE_CHÚDE_DEÚELÚEL_GRÚGUÚGU_INÚHEÚHE_ILÚHIÚHI_INÚHUÚHU_HUÚISÚIS_ISÚIDÚID_IDÚITÚIT_ITÚIT_CHÚJAÚJA_JPÚJVÚJV_IDÚKNÚKN_INÚKKÚKK_KZÚKMÚKM_KHÚKOÚKO_KRÚLOÚLO_LAÚLVÚLV_LVÚLTÚLT_LTÚMKÚMK_MKÚMSÚMS_MYÚMLÚML_INÚMRÚMR_INÚMNÚMN_MNÚNEÚNE_NPÚNOÚNBÚNB_NOÚFAÚFA_IRÚPLÚPL_PLÚPTÚPT_BRÚPT_PTÚPAÚPA_INÚROÚRO_ROÚRUÚRU_RUÚSRÚSR_RSÚSIÚSI_LKÚSKÚSK_SKÚSLÚSL_SIÚESÚES_ARÚES_BOÚES_CLÚES_COÚES_CRÚES_DOÚES_ECÚES_ESÚES_GTÚES_HNÚES_MXÚES_NIÚES_PAÚES_PEÚES_PRÚES_PYÚES_SVÚES_USÚES_UYÚES_VEÚSUÚSU_IDÚSWÚSW_KEÚSW_TZÚSVÚSV_SEÚTAÚTA_INÚTA_MYÚTA_SGÚTA_LKÚTEÚTE_INÚTHÚTH_THÚTRÚTR_TRÚUKÚUK_UAÚURÚUR_INÚUR_PKÚUZÚUZ_UZÚVIÚVI_VNÚXHÚZUÚZU_ZAr   )r%   ÚLANGUAGE_MAP© rý   úO/home/ubuntu/.local/lib/python3.10/site-packages/pipecat/services/google/stt.pyÚlanguage_to_google_stt_language>   s4  	þýûúø	÷õôóòñðïîíìëêéèçæäãá à"Þ#Ý%Û&Ú'Ù)×*Ö,Ô-Ó/Ñ0Ð2Î3Í5Ë6Ê7É8È9Ç:Æ<Ä=Ã?Á@ÀB¾C½E»FºG¹I·J¶KµL´M³N²O±P°Q¯R®S­T¬U«VªW©X¨Z¦[¥]£^¢` aŸcdœe›fšg™i—j–l”m“o‘pqrŽtŒu‹w‰xˆz†{…}ƒ~‚  ÿ  þ  ü  û  ù  ø 
 ö  õ  ô  ò  ñ  ï  î  ì  ë  é  è  æ  å  ã  â   à ! ß # Ý $ Ü & Ú ' Ù ) × * Ö , Ô - Ó / Ñ 0 Ð 2 Î 3 Í 5 Ë 6 Ê 8 È 9 Ç ; Å < Ä = Ã ? Á @ À B ¾ C ½ E » F º G ¹ I · J ¶ L ´ M ³ O ± P ° R ® S ­ U « V ª X ¨ Y § [ ¥ \ ¤ ^ ¢ _ ¡ `   a Ÿ b ž c  d œ e › f š g ™ h ˜ i — j – k • l ” m “ n ’ o ‘ p  q  r Ž t Œ u ‹ w ‰ x ˆ y ‡ { … | „ ~ ‚      ÿ    þ    ý    û    ú    ø  	  ÷    õ    ô    ò    ñ    ï    î    í    â  !rÿ   c                   @   s8  e Zd ZU dZedd„ dZee eB e	d< edd„ dZ
ee eB e	d< edd„ dZeeB e	d	< ed
d„ dZeeB e	d< edd„ dZeeB e	d< edd„ dZeeB e	d< edd„ dZeeB e	d< edd„ dZeeB e	d< edd„ dZeeB e	d< edd„ dZeeB e	d< edd„ dZeeB e	d< dS )ÚGoogleSTTSettingsa¢  Settings for GoogleSTTService.

    Parameters:
        languages: List of ``Language`` enums for recognition
            (e.g. ``[Language.EN_US]``). Preferred over ``language_codes``.
        language_codes: List of Google STT language code strings
            (e.g. ``["en-US"]``).

            .. deprecated:: 0.0.104
                Use ``languages`` instead. If both are provided, ``languages``
                takes precedence. This field is here just for backward
                compatibility with dict-based settings updates.
        use_separate_recognition_per_channel: Process each audio channel separately.
        enable_automatic_punctuation: Add punctuation to transcripts.
        enable_spoken_punctuation: Include spoken punctuation in transcript.
        enable_spoken_emojis: Include spoken emojis in transcript.
        profanity_filter: Filter profanity from transcript.
        enable_word_time_offsets: Include timing information for each word.
        enable_word_confidence: Include confidence scores for each word.
        enable_interim_results: Stream partial recognition results.
        enable_voice_activity_events: Detect voice activity in audio.
    c                   C   ó   t S ©N©r   rý   rý   rý   rþ   Ú<lambda>‚  ó    zGoogleSTTSettings.<lambda>©Údefault_factoryÚ	languagesc                   C   r  r  r  rý   rý   rý   rþ   r  ƒ  r  Úlanguage_codesc                   C   r  r  r  rý   rý   rý   rþ   r  …  r  Ú$use_separate_recognition_per_channelc                   C   r  r  r  rý   rý   rý   rþ   r  ‡  r  Úenable_automatic_punctuationc                   C   r  r  r  rý   rý   rý   rþ   r  ˆ  r  Úenable_spoken_punctuationc                   C   r  r  r  rý   rý   rý   rþ   r  ‰  r  Úenable_spoken_emojisc                   C   r  r  r  rý   rý   rý   rþ   r  Š  r  Úprofanity_filterc                   C   r  r  r  rý   rý   rý   rþ   r  ‹  r  Úenable_word_time_offsetsc                   C   r  r  r  rý   rý   rý   rþ   r  Œ  r  Úenable_word_confidencec                   C   r  r  r  rý   rý   rý   rþ   r    r  Úenable_interim_resultsc                   C   r  r  r  rý   rý   rý   rþ   r  Ž  r  Úenable_voice_activity_eventsN)Ú__name__Ú
__module__Ú__qualname__Ú__doc__r   r  r	   r   r   Ú__annotations__r	  Ústrr
  Úboolr  r  r  r  r  r  r  r  rý   rý   rý   rþ   r   i  s   
 ÿr   c                       s"  e Zd ZU dZeZeed< dZG dd„ deƒZ	dddddde
dœd	ee d
ee dedee dee	 dee dee f‡ fdd„Zdefdd„Zdeee B deee B fdd„Zdee fdd„Zdd„ Zdee fdd„Zdedeeef f‡ fd d!„Zd"ef‡ fd#d$„Zd"ef‡ fd%d&„Zd"ef‡ fd'd(„Z dddddddddddd)œdeee  d*ee d+ee d,ee d-ee d.ee d/ee d0ee d1ee d2ee dee ddfd3d4„Z!d5d6„ Z"d7d8„ Z#d9d:„ Z$d;d<„ Z%d=e&de'e(df fd>d?„Z)e*	dFd@edAedee fdBdC„ƒZ+dDdE„ Z,‡  Z-S )GÚGoogleSTTServiceaŒ  Google Cloud Speech-to-Text V2 service implementation.

    Provides real-time speech recognition using Google Cloud's Speech-to-Text V2 API
    with streaming support. Handles audio transcription and optional voice activity detection.
    Implements automatic stream reconnection to handle Google's 4-minute streaming limit.

    Parameters:
        InputParams: Configuration parameters for the STT service.
        STREAMING_LIMIT: Google Cloud's streaming limit in milliseconds (4 minutes).

    Raises:
        ValueError: If neither credentials nor credentials_path is provided.
        ValueError: If project ID is not found in credentials.
    Ú	_settingsi€© c                   @   s  e Zd ZU dZedd„ dZeeee f e	d< dZ
ee e	d< dZee e	d	< d
Zee e	d< dZee e	d< dZee e	d< dZee e	d< dZee e	d< dZee e	d< d
Zee e	d< dZee e	d< edddedee fdd„ƒƒZedee fdd„ƒZdS )zGoogleSTTService.InputParamsaù  Configuration parameters for Google Speech-to-Text.

        .. deprecated:: 0.0.105
            Use ``settings=GoogleSTTService.Settings(...)`` instead.

        Parameters:
            languages: Single language or list of recognition languages. First language is primary.
            model: Speech recognition model to use.
            use_separate_recognition_per_channel: Process each audio channel separately.
            enable_automatic_punctuation: Add punctuation to transcripts.
            enable_spoken_punctuation: Include spoken punctuation in transcript.
            enable_spoken_emojis: Include spoken emojis in transcript.
            profanity_filter: Filter profanity from transcript.
            enable_word_time_offsets: Include timing information for each word.
            enable_word_confidence: Include confidence scores for each word.
            enable_interim_results: Stream partial recognition results.
            enable_voice_activity_events: Detect voice activity in audio.
        c                   C   s   t jgS r  )r   rm   rý   rý   rý   rþ   r  ¾  s    z%GoogleSTTService.InputParams.<lambda>r  r  Úlatest_longÚmodelFr
  Tr  r  r  r  r  r  r  r  Úbefore)Úmoder&   c                 C   s   t |tƒr|gS |S )zÙEnsure languages is always a list.

            Args:
                v: Single Language enum or list of Language enums.

            Returns:
                List[Language]: List of configured languages.
            )Ú
isinstancer   )ÚclsÚvrý   rý   rþ   Úvalidate_languagesÊ  s   
z/GoogleSTTService.InputParams.validate_languagesc                 C   s   t | jtƒsJ ‚| jS )z„Get languages as a guaranteed list.

            Returns:
                List[Language]: List of configured languages.
            )r   r  Úlist©Úselfrý   rý   rþ   Úlanguage_listÙ  s   z*GoogleSTTService.InputParams.language_listN)r  r  r  r  r   r  r   r   r	   r  r  r
   r  r
  r  r  r  r  r  r  r  r  r  r   Úclassmethodr#  Úpropertyr'  rý   rý   rý   rþ   ÚInputParamsª  s$   
 "
r*  NÚglobal)ÚcredentialsÚcredentials_pathÚlocationÚsample_rateÚparamsÚsettingsÚttfs_p99_latencyr,  r-  r.  r/  r0  r1  r2  c                   s  | j dtjgdddddddddddd}	|durM|  d¡ |sMt|jƒ|	_|j|	_|j|	_|j	|	_	|j
|	_
|j|	_|j|	_|j|	_|j|	_|j|	_|j|	_|durV|	 |¡ tƒ jd|||	dœ|¤Ž || _d| _d| _d| _d| _g | _g | _d| _d| _d| _d| _d| _d| _ d| _!d}
| jd	krt"| j› d
d}
d}|r³t# $|¡}| %d¡| _&t'j( )|¡}n?|rÛt*|ƒ}t# +|¡}| %d¡| _&W d  ƒ n1 sÏw   Y  t'j( ,|¡}nzt-dgd\}}|| _&W n	 t.yñ   Y nw |søt/dƒ‚| j&sÿt/dƒ‚t0j1||
d| _2dS )a§  Initialize the Google STT service.

        Args:
            credentials: JSON string containing Google Cloud service account credentials.
            credentials_path: Path to service account credentials JSON file.
            location: Google Cloud location (e.g., "global", "us-central1").
            sample_rate: Audio sample rate in Hertz.
            params: Configuration parameters for the service.

                .. deprecated:: 0.0.105
                    Use ``settings=GoogleSTTService.Settings(...)`` instead.

            settings: Runtime-updatable settings. When provided alongside deprecated
                ``params``, ``settings`` values take precedence.
            ttfs_p99_latency: P99 latency from speech end to final transcript in seconds.
                Override for your deployment. See https://github.com/pipecat-ai/stt-benchmark
            **kwargs: Additional arguments passed to STTService.
        Nr  FT)r%   r  r	  r  r
  r  r  r  r  r  r  r  r  r0  )r/  r2  r1  r   r+  z-speech.googleapis.com)Úapi_endpointÚ
project_idz.https://www.googleapis.com/auth/cloud-platform)ÚscopeszNo valid credentials provided.z#Project ID not found in credentials)r,  Úclient_optionsrý   )3ÚSettingsr   rm   Ú"_warn_init_param_moved_to_settingsr$  r'  r  r  r
  r  r  r  r  r  r  r  r  Úapply_updateÚsuperÚ__init__Ú	_locationÚ_streamÚ_configÚ_streaming_taskÚ_stream_start_timeÚ_last_audio_inputÚ_audio_inputÚ_result_end_timeÚ_is_final_end_timeÚ_final_request_end_timeÚ_bridging_offsetÚ_last_transcript_was_finalÚ_new_streamÚ_restart_counterr   ÚjsonÚloadsÚgetÚ_project_idr$   ÚCredentialsÚfrom_service_account_infoÚopenÚloadÚfrom_service_account_filer    r!   Ú
ValueErrorr"   ÚSpeechAsyncClientÚ_client)r&  r,  r-  r.  r/  r0  r1  r2  ÚkwargsÚdefault_settingsr6  ÚcredsÚjson_account_infoÚfr4  ©Ú	__class__rý   rþ   r;  ã  s    ó
ÿ
ýü



þ
ÿ
ÿzGoogleSTTService.__init__r&   c                 C   s   dS )zŠCheck if the service can generate metrics.

        Returns:
            bool: True, as this service supports metrics generation.
        Trý   r%  rý   rý   rþ   Úcan_generate_metricsc  s   z%GoogleSTTService.can_generate_metricsr%   c                 C   s$   t |tƒrdd„ |D ƒS t|ƒpdS )zâConvert Language enum(s) to Google STT language code(s).

        Args:
            language: Single Language enum or list of Language enums.

        Returns:
            str | List[str]: Google STT language code(s).
        c                 S   s   g | ]}t |ƒp	d ‘qS )r'   )rÿ   ©Ú.0Úlangrý   rý   rþ   Ú
<listcomp>u  s    zAGoogleSTTService.language_to_service_language.<locals>.<listcomp>r'   )r   r$  rÿ   )r&  r%   rý   rý   rþ   Úlanguage_to_service_languagek  s   
	z-GoogleSTTService.language_to_service_languagec                    s8   ˆ j jr‡ fdd„ˆ j jD ƒS ˆ j jrtˆ j jƒS dgS )a-  Resolve the current language settings to Google STT language code strings.

        Prefers ``languages`` (``Language`` enums) over the deprecated
        ``language_codes`` (raw strings). Falls back to ``["en-US"]``.

        Returns:
            List[str]: Google STT language code strings.
        c                    s   g | ]}ˆ   |¡‘qS rý   )rb  r^  r%  rý   rþ   ra  ‚  s    z8GoogleSTTService._get_language_codes.<locals>.<listcomp>r'   )r  r  r	  r$  r%  rý   r%  rþ   Ú_get_language_codesx  s
   	z$GoogleSTTService._get_language_codesc                 Ã   s6   | j rt d¡ |  ¡ I dH  |  ¡ I dH  dS dS )z.Reconnect the stream if it's currently active.z0Reconnecting stream due to configuration changesN)r?  r   ÚdebugÚ_disconnectÚ_connectr%  rý   rý   rþ   Ú_reconnect_if_needed‡  s   €
ýz%GoogleSTTService._reconnect_if_neededr  c                 Ã   sp   t  ¡  t  d¡ t  dt¡ W d  ƒ n1 sw   Y  t d|› ¡ |  | jt	|ƒd¡I dH  dS )a+  Update the service's recognition languages.

        .. deprecated:: 0.0.104
            Use ``STTUpdateSettingsFrame`` with ``GoogleSTTService.Settings(languages=...)``
            instead.

        Args:
            languages: List of languages for recognition. First language is primary.
        Úalwayszdset_languages() is deprecated. Use STTUpdateSettingsFrame with self.Settings(languages=...) instead.NzSwitching STT languages to: )r  )
ÚwarningsÚcatch_warningsÚsimplefilterÚwarnÚDeprecationWarningr   rd  Ú_update_settingsr7  r$  )r&  r  rý   rý   rþ   Úset_languagesŽ  s   €


ýþ zGoogleSTTService.set_languagesÚdeltac                 ƒ   sœ   ddl m} ||jƒr|jg|_t|_||jƒr:t ¡  t d¡ tj	dt
dd W d  ƒ n1 s5w   Y  tƒ  |¡I dH }|rL|  ¡ I dH  |S )aß  Apply settings delta and reconnect if anything changed.

        Handles ``language`` from base ``set_language`` by converting it to
        ``languages``. Emits a deprecation warning if ``language_codes`` is
        used. All other fields (model, boolean flags) are applied directly.
        Reconnects the stream on any change.

        Args:
            delta: A settings delta.

        Returns:
            Dict mapping changed field names to their previous values.
        r   )Úis_givenrh  zaself.Settings.language_codes is deprecated. Use self.Settings.languages (List[Language]) instead.é   )Ú
stacklevelN)Úpipecat.services.settingsrq  r%   r  r   r	  ri  rj  rk  rl  rm  r:  rn  rg  )r&  rp  rq  Úchangedr[  rý   rþ   rn  ¢  s$   €




üþ	z!GoogleSTTService._update_settingsÚframec                 ƒ   ó&   t ƒ  |¡I dH  |  ¡ I dH  dS )zˆStart the STT service and establish connection.

        Args:
            frame: The start frame triggering the service start.
        N)r:  Ústartrf  ©r&  rv  r[  rý   rþ   rx  Ê  ó   €zGoogleSTTService.startc                 ƒ   rw  )z‚Stop the STT service and clean up resources.

        Args:
            frame: The end frame triggering the service stop.
        N)r:  Ústopre  ry  r[  rý   rþ   r{  Ó  rz  zGoogleSTTService.stopc                 ƒ   rw  )zCancel the STT service and clean up resources.

        Args:
            frame: The cancel frame triggering the service cancellation.
        N)r:  Úcancelre  ry  r[  rý   rþ   r|  Ü  rz  zGoogleSTTService.cancel)r  r  r  r  r  r  r  r  r  r  r.  r  r  r  r  r  r  r  r  r  c                Ã   s
  t  ¡  t  d¡ t  dt¡ W d  ƒ n1 sw   Y  |  ¡ }|dur-t|ƒ|_|dur4||_|dur;||_	|durB||_
|durI||_|durP||_|durW||_|dur^||_|	dure|	|_|
durl|
|_|dur{t d|› ¡ || _|  |¡I dH  dS )a  Update service options dynamically.

        .. deprecated::
            Use ``STTUpdateSettingsFrame`` with ``GoogleSTTService.Settings(...)``
            instead.

        Args:
            languages: New list of recognition languages.
            model: New recognition model.
            enable_automatic_punctuation: Enable/disable automatic punctuation.
            enable_spoken_punctuation: Enable/disable spoken punctuation.
            enable_spoken_emojis: Enable/disable spoken emojis.
            profanity_filter: Enable/disable profanity filter.
            enable_word_time_offsets: Enable/disable word timing info.
            enable_word_confidence: Enable/disable word confidence scores.
            enable_interim_results: Enable/disable interim results.
            enable_voice_activity_events: Enable/disable voice activity detection.
            location: New Google Cloud location.

        Note:
            Changes that affect the streaming configuration will cause
            the stream to be reconnected.
        rh  z[update_options() is deprecated. Use STTUpdateSettingsFrame with self.Settings(...) instead.NzUpdating location to: )ri  rj  rk  rl  rm  r7  r$  r  r  r  r  r  r  r  r  r  r  r   rd  r<  rn  )r&  r  r  r  r  r  r  r  r  r  r  r.  rp  rý   rý   rþ   Úupdate_optionså  sB   €
&
ýþ
zGoogleSTTService.update_optionsc                 Ã   sÈ   t  d¡ tt ¡ d ƒ| _d| _tjtjtj	tj	j
j| jdd|  ¡ | jjtj| jj| jj| jj| jj| jj| jjddtj| jj| jjdd	| _t ¡ | _|  |  ¡ ¡| _ |  !d
¡I dH  dS )z3Initialize streaming recognition config and stream.z#Connecting to Google Speech-to-Textéè  Té   )ÚencodingÚsample_rate_hertzÚaudio_channel_count)r  r  r  r  r  r  )Úexplicit_decoding_configr	  r  Úfeatures)r  Úinterim_results)ÚconfigÚstreaming_featuresÚon_connectedN)"r   rd  ÚintÚtimer@  rH  r#   ÚStreamingRecognitionConfigÚRecognitionConfigÚExplicitDecodingConfigÚAudioEncodingÚLINEAR16r/  rc  r  r  ÚRecognitionFeaturesr  r  r  r  r  r  ÚStreamingRecognitionFeaturesr  r  r>  ÚasyncioÚQueueÚ_request_queueÚcreate_taskÚ_stream_audior?  Ú_call_event_handlerr%  rý   rý   rþ   rf  0  s<   €
ýúøþî
zGoogleSTTService._connectc                 Ã   s>   | j rt d¡ |  | j ¡I dH  d| _ |  d¡I dH  dS )z)Clean up streaming recognition resources.z(Disconnecting from Google Speech-to-TextNÚon_disconnected)r?  r   rd  Úcancel_taskr—  r%  rý   rý   rþ   re  U  s   €
zGoogleSTTService._disconnectc              
   C  s  d| j › d| j› d}t d|› ¡ zRtj|| jdV  	 | j ¡ I dH }| j 	¡  t
t ¡ d ƒ| j | jkrYt d	¡ | j| _g | _|  jd
7  _| j |¡I dH  W dS | j |¡ tj|dV  q ty€ } z| jd|› |dI dH  ‚ d}~ww )z6Generates requests for the streaming recognize method.z	projects/z/locations/z/recognizers/_zUsing recognizer path: )Ú
recognizerÚstreaming_configTNr~  z9Streaming limit reached, initiating graceful reconnectionr  )ÚaudioúUnknown error occurred: ©Ú	error_msgÚ	exception)rM  r<  r   Útracer#   ÚStreamingRecognizeRequestr>  r”  rL  Ú	task_doner‰  rŠ  r@  ÚSTREAMING_LIMITrd  rB  rA  rI  ÚputÚappendÚ	ExceptionÚ
push_error)r&  Úrecognizer_pathÚ
audio_dataÚerý   rý   rþ   Ú_request_generator^  s4   €þ

ï€þz#GoogleSTTService._request_generatorc              
   Ã   s6  zy	 zF| j  ¡ rt d¡I dH  W q| jj|  ¡ dI dH }|  |¡I dH  tt	 	¡ d ƒ| j
 | jkrDt d¡ tt	 	¡ d ƒ| _
nW W dS W n0 tyy } z$| jd|› |dI dH  t d	¡I dH  tt	 	¡ d ƒ| _
W Y d}~nd}~ww q tyš } z| jd|› |dI dH  W Y d}~dS d}~ww )
z0Handle bi-directional streaming with Google STT.Tg{®Gáz„?N)Úrequestsr~  z!Reconnecting stream after timeoutr  rž  r  )r”  Úemptyr’  ÚsleeprU  Ústreaming_recognizer¬  Ú_process_responsesr‰  rŠ  r@  r¤  r   rd  r§  r¨  )r&  r°  r«  rý   rý   rþ   r–    s6   €
ÿ
ý€üè(€ÿzGoogleSTTService._stream_audiorœ  c                 C  s2   | j r|  ¡ I dH  | j |¡I dH  dV  dS )zâProcess an audio chunk for STT transcription.

        Args:
            audio: Raw audio bytes to transcribe.

        Yields:
            Frame: None (actual transcription frames are pushed via internal processing).
        N)r?  Ústart_processing_metricsr”  r¥  )r&  rœ  rý   rý   rþ   Úrun_stt¥  s
   €	
zGoogleSTTService.run_sttÚ
transcriptÚis_finalc                 Ã   s   d S r  rý   )r&  r´  rµ  r%   rý   rý   rþ   Ú_handle_transcription´  s   €z&GoogleSTTService._handle_transcriptionc                 Ã   s^  z|2 zx3 dH W }t t ¡ d ƒ| j | jkr!t d¡  W dS |js%q|jD ]S}|js.q(|jd j}|s7q(|  	¡ d }|j
rgd| _|  t|| jtƒ ||d¡I dH  |  ¡ I dH  | j|d|dI dH  q(d| _|  t|| jtƒ ||d¡I dH  q(q6 W dS  ty• } z	t | › d	¡ ‚ d}~w ty® } z| jd
|› |dI dH  ‚ d}~ww )z(Process streaming recognition responses.Nr~  z-Stream timeout reached in response processingr   T)Úresult)rµ  r%   FzQ Stream aborted due to inactivity (no audio input). Reconnecting automatically...r  rž  )r‰  rŠ  r@  r¤  r   rd  ÚresultsÚalternativesr´  rc  rµ  rG  Ú
push_framer   Ú_user_idr   Ústop_processing_metricsr¶  r   r   r§  r¨  )r&  r°  Úresponser·  r´  Úprimary_languager«  rý   rý   rþ   r±  º  sn   €

û
ÿ	ýûÿã÷/ÿ€€üz#GoogleSTTService._process_responsesr  ).r  r  r  r  r   r7  r  r¤  r   r*  r   r
   r  r‰  Úfloatr;  r  r]  r   r	   rb  rc  rg  ro  Údictr   rn  r   rx  r   r{  r   r|  r}  rf  re  r¬  r–  Úbytesr   r   r³  r   r¶  r±  Ú__classcell__rý   rý   r[  rþ   r  ‘  s²   
 <÷ýüûúùø	÷ "(		ó
ýüûúùø	÷
öõôó
òK%	#$ÿÿÿÿr  )Br  r’  rJ  ÚosrŠ  ri  Údataclassesr   r   Ú(pipecat.utils.tracing.service_decoratorsr   ÚenvironÚtypingr   r   r	   r
   r   Úlogurur   Úpydanticr   r   r   Úpipecat.frames.framesr   r   r   r   r   r   rt  r   r   r   Úpipecat.services.stt_latencyr   Úpipecat.services.stt_servicer   Úpipecat.transcriptions.languager   r   Úpipecat.utils.timer   Úgoogle.api_core.client_optionsr   Úgoogle.api_core.exceptionsr   Úgoogle.authr    Úgoogle.auth.exceptionsr!   Úgoogle.cloudr"   Úgoogle.cloud.speech_v2.typesr#   Úgoogle.oauth2r$   ÚModuleNotFoundErrorr«  Úerrorr§  r  rÿ   r   r  rý   rý   rý   rþ   Ú<module>   sP   
 ÿ€û  -'