o Ã¿i84ã@s*UdZddlmZmZddlmZmZmZmZddl m Z ddlmZddl mZddlmZmZddlmZmZmZmZdd lmZmZmZdd lmZddlmZmZddl m!Z!d dd dœZ"ee#e$fe%d<dedee#fdd„Z&de'de(e'e'ffdd„Z)eGdd„deƒƒZ*Gdd„deƒZ+dS)a¤Camb.ai MARS text-to-speech service implementation. This module provides TTS functionality using Camb.ai's MARS model family, offering high-quality text-to-speech synthesis with streaming support. Features: - MARS models: mars-flash (fast), mars-pro (high quality) - 140+ languages supported - Real-time streaming via official SDK - Model-specific sample rates: mars-pro (48kHz), mars-flash (22.05kHz) é)Ú dataclassÚfield)ÚAnyÚAsyncGeneratorÚDictÚOptional)ÚStreamTtsOutputConfiguration)ÚAsyncCambAI)Úlogger)Ú BaseModelÚField)Ú ErrorFrameÚFrameÚ StartFrameÚTTSAudioRawFrame)Ú NOT_GIVENÚTTSSettingsÚ _NotGiven)Ú TTSService)ÚLanguageÚresolve_language)Ú traced_ttsé"Vi€»)ú mars-flashzmars-proú mars-instructÚMODEL_SAMPLE_RATESÚlanguageÚreturncCsøitjd“tjd“tjd“tjd“tjd“tjd“tjd“tjd“tj d“tj d“tjd“tjd“tj d “tjd “tjd“tjd “tjd“itjd “tjd“tjd“tjd“tjd“tjd“tjd“tjd“tjd“tjd“tjd“tjd“tjd“tjd“tj d“tj!d“tj"d“¥itj#d“tj$d“tj%d“tj&d “tj'd!“tj(d"“tj)d#“tj*d$“tj+d%“tj,d&“tj-d'“tj.d(“tj/d)“tj0d*“tj1d+“tj2d,“tj3d-“¥tj4d.tj5d/tj6d0tj7d1tj8d2tj9d3tj:d4tj;d5tjd8i¥}t?||d9d:S);zèConvert a Pipecat Language enum to Camb.ai language code. Args: language: The Language enum value to convert. Returns: The corresponding Camb.ai language code (BCP-47 format), or None if not supported. úen-uszen-gbzen-auzes-eszes-mxzfr-frzfr-cazde-dezit-itzpt-ptzpt-brznl-nlzpl-plzru-ruzja-jpzko-krzzh-cnzzh-twzar-sazhi-inztr-trzvi-vnzth-thzid-idzms-myzsv-sezda-dkzno-nozfi-fizcs-czzel-grzhe-ilzhu-huzro-rozsk-skzuk-uazbg-bgzhr-hrzsr-rszsl-sizca-eszeu-eszgl-eszaf-zazsw-kezta-inzte-inzbn-inzmr-inzgu-inzkn-inzml-inzpa-inzur-pkzfa-irztl-phT)Ú use_base_code)@rÚENÚEN_USÚEN_GBÚEN_AUÚESÚES_ESÚES_MXÚFRÚFR_FRÚFR_CAÚDEÚDE_DEÚITÚPTÚPT_BRÚPT_PTÚNLÚPLÚRUÚJAÚKOÚZHÚZH_CNÚZH_TWÚARÚHIÚTRÚVIÚTHÚIDÚMSÚSVÚDAÚNOÚFIÚCSÚELÚHEÚHUÚROÚSKÚUKÚBGÚHRÚSRÚSLÚCAÚEUÚGLÚAFÚSWÚTAÚTEÚBNÚMRÚGUÚKNÚMLÚPAÚURÚFAÚTLr)rÚLANGUAGE_MAP©r_úM/home/ubuntu/.local/lib/python3.10/site-packages/pipecat/services/camb/tts.pyÚlanguage_to_camb_language.sè ÿþýüûúùø ÷ öõô óòñðïîíìëêéèçæåäãâá à!ß"Þ#Ý$Ü%Û&Ú'Ù(Ø)×*Ö+Õ,Ô-Ó.Ò/Ñ0Ð1Ï2Î3Í4ÂAraÚbuffercCs(t|ƒdd}|d|…||d…fS)zÀSplit buffer into aligned audio (2-byte samples) and remainder. Args: buffer: Raw audio bytes to align. Returns: Tuple of (aligned audio bytes, remaining bytes). éN)Úlen)rbÚaligned_sizer_r_r`Ú_get_aligned_audio{s rfc@sJeZdZUdZedd„dZeeBed<edd„dZ e dBeBed<dS) ÚCambTTSSettingsa5Settings for CambTTSService. Parameters: voice: Camb.ai voice ID. Overrides ``TTSSettings.voice`` (str) because Camb.ai uses integer voice IDs. user_instructions: Custom instructions for mars-instruct model only. Ignored for other models. Max 1000 characters. cCótS©N©rr_r_r_r`Ú“ózCambTTSSettings.)Údefault_factoryÚvoicecCrhrirjr_r_r_r`rk”rlNÚuser_instructions)Ú__name__Ú __module__Ú__qualname__Ú__doc__rrnÚintrÚ__annotations__roÚstrr_r_r_r`rgˆs "rgcsØeZdZUdZeZeed<Gdd„deƒZdddddddœde d e ed e e dede ed e ede ef‡fdd„Z defdd„Zdede e fdd„Zdef‡fdd„Zede de deedffdd„ƒZ‡ZS)ÚCambTTSServicea÷Camb.ai MARS text-to-speech service using the official SDK. Converts text to speech using Camb.ai's MARS TTS models with support for multiple languages. Models: - mars-flash: Fast inference, 22.05kHz output (default) - mars-pro: High quality, 48kHz output Example:: # Basic usage with mars-flash (fast) tts = CambTTSService( api_key="your-api-key", settings=CambTTSService.Settings( model="mars-flash" ) ) # High quality with mars-pro tts = CambTTSService( api_key="your-api-key", settings=CambTTSService.Settings( voice=12345, model="mars-pro", ) ) Ú _settingsc@s>eZdZUdZejZeeed<e ddddZ eeed<dS)zCambTTSService.InputParamsa”Input parameters for Camb.ai TTS configuration. .. deprecated:: 0.0.105 Use ``settings=CambTTSService.Settings(...)`` instead. Parameters: language: Language for synthesis (BCP-47 format). Defaults to English. user_instructions: Custom instructions for mars-instruct model only. Ignored for other models. Max 1000 characters. rNièztCustom instructions for mars-instruct model only. Use to control tone, style, or pronunciation. Max 1000 characters.)ÚdefaultÚ max_lengthÚdescriptionro)rprqrrrsrr rrrurrorvr_r_r_r`ÚInputParams¸s ýr|NgN@)Úvoice_idÚmodelÚtimeoutÚsample_rateÚparamsÚsettingsÚapi_keyr}r~rr€rr‚c s|jddddd} |dur| dd¡|| _|dur#| dd¡|| _|dur@| d ¡|s@|jdur7|j| _|jdur@|j| _|durI| |¡| j} |rg|t | ¡krgt d | ›dt | ¡›d|›d ¡tƒjd|dd| dœ|¤Ž||_ ||_d|_dS)aWInitialize the Camb.ai TTS service. Args: api_key: Camb.ai API key for authentication. voice_id: Voice ID to use. .. deprecated:: 0.0.105 Use ``settings=CambTTSService.Settings(voice=...)`` instead. model: TTS model to use. Options: "mars-flash" (fast), "mars-pro" (high quality). .. deprecated:: 0.0.105 Use ``settings=CambTTSService.Settings(model=...)`` instead. timeout: Request timeout in seconds. Defaults to 60.0 (minimum recommended by Camb.ai). sample_rate: Audio sample rate in Hz. If None, uses model-specific default. params: Additional voice parameters. If None, uses defaults. .. deprecated:: 0.0.105 Use ``settings=CambTTSService.Settings(...)`` instead. settings: Runtime-updatable settings. When provided alongside deprecated parameters, ``settings`` values take precedence. **kwargs: Additional arguments passed to parent TTSService. rix?rN)r~rnrror~r}rnrz Camb.ai's z model only supports z Hz sample rate. Current rate of zHz may cause issues.T)r€Úpush_start_frameÚpush_stop_framesr‚r_)ÚSettingsÚ"_warn_init_param_moved_to_settingsr~rnrroÚapply_updaterÚgetr ÚwarningÚsuperÚ__init__Ú_api_keyÚ_timeoutÚ_client)Úselfrƒr}r~rr€rr‚ÚkwargsÚdefault_settingsÚ_model©Ú __class__r_r`rŒÌsN'ü ÿÿüû zCambTTSService.__init__rcCsdS)z“Check if this service can generate processing metrics. Returns: True, as Camb.ai service supports metrics generation. Tr_)rr_r_r`Úcan_generate_metrics$sz#CambTTSService.can_generate_metricsrcCst|ƒS)zÖConvert a Language enum to Camb.ai language format. Args: language: The language to convert. Returns: The Camb.ai-specific language code, or None if not supported. )ra)rrr_r_r`Úlanguage_to_service_language,s z+CambTTSService.language_to_service_languageÚframecƒsFtƒ |¡IdHt|j|jd|_|js!t |j j d¡|_dSdS)zStart the Camb.ai TTS service. Args: frame: The start frame containing initialization parameters. N)rƒrr)r‹Ústartr rrŽrÚ_init_sample_raterr‰rxr~Ú_sample_rate)rr˜r”r_r`r™7s€ÿzCambTTSService.startÚtextÚ context_idc Cs€t |›d|›d¡t|ƒdkrt d¡|dd…}z†||jj|jj|jjtdddœ}|jjd kr?|jj r?|jj |d <| |¡IdH|jdusPJdƒ‚d}|jjj di|¤Ž2z%3dHW}|r| ¡IdH||7}t|ƒ\}}|rt||jd |dVq\6t|ƒdkržt|ƒ\}}|r¡t||jd |dVWdSWdSWdSty¿}ztd|›dVWYd}~dSd}~ww)a,Generate speech from text using Camb.ai's TTS API. Args: text: The text to synthesize into speech (max 3000 characters). context_id: The context ID for tracking audio frames. Yields: Frame: Audio frames containing the synthesized speech. z: Generating TTS [ú]i¸z:Text too long for Camb.ai TTS (max 3000 chars), truncatingNÚ pcm_s16le)Úformat)rœr}rÚspeech_modelÚoutput_configurationrroz#Camb.ai TTS service not initializedóé)Úaudior€Únum_channelsrrczCamb.ai TTS error: )Úerrorr_)r ÚdebugrdrŠrxrnrr~rroÚstart_tts_usage_metricsrÚtext_to_speechÚttsÚstop_ttfb_metricsrfrr€Ú Exceptionr ) rrœrÚ tts_kwargsÚaudio_bufferÚchunkÚ aligned_audioÚ_Úer_r_r`Úrun_ttsEs\€ û ü€øüý €ÿzCambTTSService.run_tts)rprqrrrsrgr†rurr|rvrrtÚfloatrŒÚboolr–rr—rr™rrrr´Ú __classcell__r_r_r”r`rw—s> ÷ýüûúùø ÷X(rwN),rsÚdataclassesrrÚtypingrrrrÚcambrÚcamb.clientr Úlogurur ÚpydanticrrÚpipecat.frames.framesr rrrÚpipecat.services.settingsrrrÚpipecat.services.tts_servicerÚpipecat.transcriptions.languagerrÚ(pipecat.utils.tracing.service_decoratorsrrrvrtruraÚbytesÚtuplerfrgrwr_r_r_r`Ús*ýM