o €o™iëZã@s UddlmZmZmZmZmZddlZddlmm Z ddlmZddlmZddl mZmZmZmZmZddlmZmZddlmZddlmZd Zeed <ddgZeeed <gd¢Zeeed<gd¢Zeeed<eeedœZ ee!eefed<dd„dDƒZ"ee!e!fed<d6de#dee!effdd„Z$de#de#defdd „Z%Gd!d"„d"ej&ƒZ'Gd#d$„d$ej&ƒZ(Gd%d&„d&ej&ƒZ)d'e!d(ee!efdefd)d*„Z*Gd+d,„d,ej&ƒZ+Gd-d.„d.ej&ƒZ,Gd/d0„d0ej&ƒZ-d'e!d1e!dee!effd2d3„Z.Gd4d5„d5ej&ƒZ/dS)7é)ÚAnyÚDictÚListÚTupleÚUnionN)Únn)Úpi)ÚTensorÚcosÚsinÚtensorÚzeros)ÚGaussianBlur2dÚSpatialGradient)Úcart2pol)Úcreate_meshgridgÍ;fž ö?Úsqrt2gp©ßuØ?g ·"ÇÞ?ÚCOEFFS_N1_K1)ç"¹g#ø[Â?ç–x@Ù”+Ñ?çKÈ'"Ì?ÚCOEFFS_N2_K8)rrrgËˆfùFÄ?ÚCOEFFS_N3_K8)ÚxyÚrhophiÚthetaÚCOEFFScCsi|] }|d|›d“qS)zChttps://github.com/manyids2/mkd_pytorch/raw/master/mkd_pytorch/mkd-z-64.pth©)Ú.0ÚkrrúF/home/ubuntu/.local/lib/python3.10/site-packages/kornia/feature/mkd.pyÚ %sÿÿr!)ÚcartÚpolarÚconcatÚurlsé Ú patch_sizeÚreturncCs^t||dd}|ddd…dd…df}|ddd…dd…df}t||ƒ\}}||||dœ}|S)z1Get cartesian and polar parametrizations of grid.T©ÚheightÚwidthÚnormalized_coordinatesrNé)ÚxÚyÚrhoÚphi)rr)r'Úkgridr.r/r0r1Ú grid_dictrrr Ú get_grid_dict+sr4Úd1Úd2cCsFtjt |¡t |¡dd\}}tj||gdd dd¡}| tj¡S)z&Get order for doing kronecker product.Úij)Úindexingé©Údiméÿÿÿÿ)ÚtorchÚmeshgridÚarangeÚstackÚreshapeÚtoÚint64)r5r6Úgrid_d1Úgrid_d2Ú kron_orderrrr Úget_kron_order5s rGcsBeZdZdZd‡fdd„Zdedefdd„Zdefd d „Z‡Z S)ÚMKDGradientsaŽModule, which computes gradients of given patches, stacked as [magnitudes, orientations]. Given gradients $g_x$, $g_y$ with respect to $x$, $y$ respectively, - $\mathbox{mags} = $\sqrt{g_x^2 + g_y^2 + eps}$ - $\mathbox{oris} = $\mbox{tan}^{-1}(\nicefrac{g_y}{g_x})$. Args: patch_size: Input patch size in pixels. Returns: gradients of given patches. Shape: - Input: (B, 1, patch_size, patch_size) - Output: (B, 2, patch_size, patch_size) Example: >>> patches = torch.rand(23, 1, 32, 32) >>> gradient = MKDGradients() >>> g = gradient(patches) # 23x2x32x32 r(Ncs$tƒ ¡d|_tdddd|_dS)Nç:Œ0âŽyE>Údiffr-F)ÚmodeÚorderÚ normalized)ÚsuperÚ__init__ÚepsrÚgrad©Úself©Ú __class__rr rOTs zMKDGradients.__init__r.cCs¦t|tƒstdt|ƒ›ƒ‚t|jƒdkstd|j›ƒ‚| |¡}|dd…dd…ddd…dd…f}|dd…dd…ddd…dd…f}tj t |||jƒdd}|S)Nú Input type is not a Tensor. Got éú-Invalid input shape, we expect Bx1xHxW. Got: rr-r:)Ú isinstancer Ú TypeErrorÚtypeÚlenÚshapeÚ ValueErrorrQr=ÚcatrrP)rSr.Úgrads_xyÚgxÚgyr/rrr ÚforwardZs ""zMKDGradients.forwardcCs|jjS©N)rUÚ__name__rRrrr Ú__repr__fszMKDGradients.__repr__©r(N) reÚ __module__Ú__qualname__Ú__doc__rOr rcÚstrrfÚ __classcell__rrrTr rH<s rHc sreZdZdZdedeeeeefeeeefdffddf‡fdd„Z d e de fd d„Zdefdd „Z ‡ZS)ÚVonMisesKernelaÐModule, which computes parameters of Von Mises kernel given coefficients, and embeds given patches. Args: patch_size: Input patch size in pixels. coeffs: List of coefficients. Some examples are hardcoded in COEFFS, Returns: Von Mises embedding of given parametrization. Shape: - Input: (B, 1, patch_size, patch_size) - Output: (B, d, patch_size, patch_size) Examples: >>> oris = torch.rand(23, 1, 32, 32) >>> vm = VonMisesKernel(patch_size=32, ... coeffs=[0.14343168, ... 0.268285, ... 0.21979234]) >>> emb = vm(oris) # 23x7x32x32 r'Úcoeffs.r(Ncsîtƒ ¡||_t|ƒ}| d|¡t|ƒd}||_d|d|_t dd||g¡}t |¡d}| ddd¡}td|dgƒ}t |¡|d|d…<t |dd…¡||dd…<| ddd¡}| d|¡| d|¡| d|¡dS)Nrnr-r9r<Úemb0ÚfrangeÚweights)rNrOr'rÚregister_bufferr\ÚnÚdr=Úonesr?rAr Úsqrt)rSr'rnÚb_coeffsrsrorprqrTrr rO‚s" zVonMisesKernel.__init__r.cCsÆt|tƒstdt|ƒ›ƒ‚t|jƒdkr|jddkr$td|j›ƒ‚t|jtƒs3tdt|ƒ›ƒ‚|j |¡ | d¡ddd¡}|j |¡|}t|ƒ}t |ƒ}tj|||gdd}|j|}|S)NrVrWr-rXzEmb0 type is not a Tensor. Got rr:)rYr rZr[r\r]r^rorBÚrepeatÚsizerpr rr=r_rq)rSr.rorpÚemb1Úemb2Ú embeddingrrr rcšs zVonMisesKernel.forwardc Cs.|jj›d|j›d|j›d|j›d|j›d S)Nú(patch_size=z, n=z, d=z , coeffs=ú))rUrer'rsrtrnrRrrr rf¬s.zVonMisesKernel.__repr__)rerhrirjÚintrrÚfloatrrOr rcrkrfrlrrrTr rmjs >rmcsbeZdZdZddededdf‡fdd „ Zd edefdd„Zd edefdd„Z de fdd„Z‡ZS)ÚEmbedGradientsa=Module that computes gradient embedding, weighted by sqrt of magnitudes of given patches. Args: patch_size: Input patch size in pixels. relative: absolute or relative gradients. Returns: Gradient embedding. Shape: - Input: (B, 2, patch_size, patch_size) - Output: (B, 7, patch_size, patch_size) Examples: >>> grads = torch.rand(23, 2, 32, 32) >>> emb_grads = EmbedGradients(patch_size=32, ... relative=False) >>> emb = emb_grads(grads) # 23x7x32x32 r&Fr'Úrelativer(NcsŠtƒ ¡||_||_d|_t|tdd|_t||dd}t |dd…dd…dd…df|dd…dd…dd…dfƒ\}}| d|¡dS) NrIr©r'rnTr)rr-r1)rNrOr'r‚rPrmrÚkernelrrrr)rSr'r‚r2Ú_r1rTrr rOÆs >zEmbedGradients.__init__ÚmagscCst ||j¡}|S)z@Embed square roots of magnitudes with eps for numerical reasons.)r=rvrP)rSr†rrr Úemb_magsÔszEmbedGradients.emb_magsÚgradscCs¨t|tƒstdt|ƒ›ƒ‚t|jƒdkstd|j›ƒ‚|dd…dd…dd…dd…f}|dd…dd…dd…dd…f}|jrH||j |¡}| |¡| |¡}|S)NrVrWz-Invalid input shape, we expect Bx2xHxW. Got: r-)rYr rZr[r\r]r^r‚r1rBr„r‡)rSrˆr†Úorisr/rrr rcÙs zEmbedGradients.forwardcCs|jj›d|j›d|j›dS)Nr}z, relative=r~)rUrer'r‚rRrrr rfåszEmbedGradients.__repr__)r&F) rerhrirjrÚboolrOr r‡rcrkrfrlrrrTr r°srÚkernel_typeÚgridsc sdtttdtddœ‰|dkrd}ddg}n |dkr"d }d dg}t| ¡ƒ}||djd }‡fdd„| ¡Dƒ}dd„| ¡Dƒ}t|t|d}t|t|d}|||dƒ ¡} |||dƒ ¡} t |j |j ƒ}| d|dd…df¡| d|dd…df¡}|S)z.cSs&i|]\}}|| d¡ d¡ ¡“qS)r)Ú unsqueezer€rŽrrr r!ùs&rƒr-N)rrÚlistÚkeysr]ÚitemsrmrÚsqueezerGrtÚindex_select) r‹rŒÚcoeffs_Úparams_r”r'Úgrids_normedÚvm_aÚvm_bÚemb_aÚemb_brFÚspatial_kernelrrr Úspatial_kernel_embeddingés$ 0r c sŽeZdZdZ ddededed ed eddf‡fd d„ Zdede fdd„Z dee e ffdd„Zde de fdd„Z defdd„Z‡ZS)ÚExplicitSpacialEncodingaŠModule that computes explicit cartesian or polar embedding. Args: kernel_type: Parametrization of kernel ``'polar'`` or ``'cart'``. fmap_size: Input feature map size in pixels. in_dims: Dimensionality of input feature map. do_gmask: Apply gaussian mask. do_l2: Apply l2-normalization. Returns: Explicit cartesian or polar embedding. Shape: - Input: (B, in_dims, fmap_size, fmap_size) - Output: (B, out_dims, fmap_size, fmap_size) Example: >>> emb_ori = torch.rand(23, 7, 32, 32) >>> ese = ExplicitSpacialEncoding(kernel_type='polar', ... fmap_size=32, ... in_dims=7, ... do_gmask=True, ... do_l2=True) >>> desc = ese(emb_ori) # 23x175x32x32 r#r&éTr‹Ú fmap_sizeÚin_dimsÚdo_gmaskÚdo_l2r(Nc sÖtƒ ¡|dvrt|›dƒ‚||_||_||_||_||_t|ƒ|_ d|_ t|j|j ƒ}|jr=|jdd|_ ||j }| d| d¡¡|jd|_|j|j|_|j|_| ¡\}}| d|¡| d|¡dS) N)r#r"z" is not valid, use polar or cart).r)ÚsigmaÚembrr{Úidx1)rNrOÚNotImplementedErrorr‹r£r¤r¥r¦r4ÚgridÚgmaskr Ú get_gmaskrrr’r]Úd_embÚout_dimsÚodimsÚ init_kron) rSr‹r£r¤r¥r¦r¨r{r©rTrr rO$s* z ExplicitSpacialEncoding.__init__r§cCs6|jd|jd ¡}t d|d|d¡}|S)zCompute Gaussian mask.r0r<r9)r«Úmaxr=Úexp)rSr§Únorm_rhor¬rrr rLsz!ExplicitSpacialEncoding.get_gmaskcCsLt|j|jƒ}tj t|j¡}t |d|dd…df¡}||dd…dffS)z3Initialize helper variables to calculate kronecker.r-Nr) rGr¤r®r=ÚjitÚannotater r¨r—)rSÚkronÚ_embr{rrr r±Rsz!ExplicitSpacialEncoding.init_kronr.cCsžt|tƒstdt|ƒ›ƒ‚t|jƒdk|jd|jkBs)td|j›d|j›ƒ‚tj t|j¡}t |d|¡}||j }|jdd}|jrMtj|dd}|S)NrVrWr-z!Invalid input shape, we expect BxzxHxW. Got: )r9ér:)rYr rZr[r\r]r¤r^r=rµr¶r©r—r{Úsumr¦ÚFÚ normalize)rSr.r©rzÚoutputrrr rcYs zExplicitSpacialEncoding.forwardcCs>|jj›d|j›d|j›d|j›d|j›d|j›d|j›dS)Nz (kernel_type=z, fmap_size=ú , in_dims=z, out_dims=z, do_gmask=z, do_l2=r~)rUrer‹r£r¤r¯r¥r¦rRrrr rffs ÿþýüûúÿz ExplicitSpacialEncoding.__repr__)r#r&r¢TT)rerhrirjrkrrŠrOr€r rrr±rcrfrlrrrTr r¡s0úþýüûúù( r¡csÈeZdZdZ ddedeeeeeeffdfded ed ede ddf‡fd d„ Z deeeeeffddfdd„Zddd„Zddd„Z ddd„Zddd„Zdedefdd„Zdefdd„Z‡ZS) Ú WhiteningaBModule, performs supervised or unsupervised whitening. This is based on the paper "Understanding and Improving Kernel Local Descriptors". See :cite:`mukundan2019understanding` for more details. Args: xform: Variant of whitening to use. None, 'lw', 'pca', 'pcaws', 'pcawt'. whitening_model: Dictionary with keys 'mean', 'eigvecs', 'eigvals' holding Tensors. in_dims: Dimensionality of input descriptors. output_dims: (int) Dimensionality reduction. keval: Shrinkage parameter. t: Attenuation parameter. Returns: l2-normalized, whitened descriptors. Shape: - Input: (B, in_dims, fmap_size, fmap_size) - Output: (B, out_dims, fmap_size, fmap_size) Examples: >>> descs = torch.rand(23, 238) >>> whitening_model = {'pca': {'mean': torch.zeros(238), ... 'eigvecs': torch.eye(238), ... 'eigvals': torch.ones(238)}} >>> whitening = Whitening(xform='pcawt', ... whitening_model=whitening_model, ... in_dims=238, ... output_dims=128, ... keval=40, ... t=0.7) >>> wdescs = whitening(descs) # 23x128 é€é(çffffffæ?ÚxformÚwhitening_modelNr¤Úoutput_dimsÚkevalÚtr(csªtƒ ¡||_||_||_||_d|_t||ƒ}||_t j t|ƒdd|_t j t |¡dd…d|…fdd|_t j t |¡d|…dd|_|durS| |¡dSdS)NrT)Ú requires_grad)rNrOrÃr¤rÆrÇÚpvalÚminrÅrÚ Parameterr Úmeanr=ÚeyeÚevecsruÚevalsÚload_whitening_parameters)rSrÃrÄr¤rÅrÆrÇrTrr rO–s &ÿzWhitening.__init__cCs€|jdkrdnd}||}|d|j_|ddd…d|j…f|j_|dd|j…|j_|j|j|j|j dœ}||jƒdS)NÚlwÚpcarÌÚeigvecsÚeigvals)rÒrÑÚpcawsÚpcawt) rÃrÌÚdatarÅrÎrÏÚ_modify_pcaÚ _modify_lwÚ _modify_pcawsÚ _modify_pcawt)rSrÄÚalgoÚwh_modelÚ modificationsrrr rÐ³süz#Whitening.load_whitening_parameterscCs d|_dS)zModify powerlaw parameter.gà?N)rÉrRrrr rØÄs zWhitening._modify_pcacCsdS)zNo modification required.NrrRrrr rÙÈszWhitening._modify_lwcCs>|j|j}d||j|}|jt t |d¡¡|j_dS)zShrinkage for eigenvalues.r-çà¿N)rÏrÆrÎr=ÚdiagÚpowr×)rSÚalpharÏrrr rÚËs zWhitening._modify_pcawscCs,d|j}|jt t |j|¡¡|j_dS)zAttenuation for eigenvalues.rßN)rÇrÎr=ràrárÏr×)rSÚmrrr rÛÑs "zWhitening._modify_pcawtr.cCszt|tƒstdt|ƒ›ƒ‚t|jƒdkstd|j›ƒ‚||j}||j}t |¡t t |¡|j ¡}tj|ddS)NrVr9z)Invalid input shape, we expect NxD. Got: r-r:)rYr rZr[r\r]r^rÌrÎr=ÚsignráÚabsrÉr»r¼©rSr.rrr rcÖs zWhitening.forwardcCs&|jj›d|j›d|j›d|j›dS)Nz(xform=r¾ú, output_dims=r~)rUrerÃr¤rÅrRrrr rfàs&zWhitening.__repr__)rÀrÁrÂrg)rerhrirjrkrrr rr€rOrÐrØrÙrÚrÛrcrfrlrrrTr r¿rs6(ùþýüûúùø" r¿c sfeZdZdZ ddeded ed ededd f‡fdd„ Zdedefdd„Zdefdd„Z ‡Z S)Ú MKDDescriptora˜Module that computes Multiple Kernel local descriptors. This is based on the paper "Understanding and Improving Kernel Local Descriptors". See :cite:`mukundan2019understanding` for more details. Args: patch_size: Input patch size in pixels. kernel_type: Parametrization of kernel ``'concat'``, ``'cart'``, ``'polar'``. whitening: Whitening transform to apply ``None``, ``'lw'``, ``'pca'``, ``'pcawt'``, ``'pcaws'``. training_set: Set that model was trained on ``'liberty'``, ``'notredame'``, ``'yosemite'``. output_dims: Dimensionality reduction. Returns: Explicit cartesian or polar embedding. Shape: - Input: :math:`(B, in_{dims}, fmap_{size}, fmap_{size})`. - Output: :math:`(B, out_{dims}, fmap_{size}, fmap_{size})`, Examples: >>> patches = torch.rand(23, 1, 32, 32) >>> mkd = MKDDescriptor(patch_size=32, ... kernel_type='concat', ... whitening='pcawt', ... training_set='liberty', ... output_dims=128) >>> desc = mkd(patches) # 23x128 r&r$rÖÚlibertyrÀr'r‹Ú whiteningÚtraining_setrÅr(Ncs@tƒ ¡||_||_||_||_d|d|_td|j|jfdƒ|_t ƒ|_ d}d}|jdkr4||gn|jg|_d|_|d |d i}i|_ |jD]$} t||| d} t| || jjd}t | |¡|j | <|j|j7_qHt||jƒ|_|jdurštjjt|jt d ¡d}||} t|| |j|jd|_|j|_| ¡dS)Nçffffffö?é@©érïÚ replicater#r"r$rTF©r'r‚©r‹r£r¤Úcpu©Úmap_location©r¤rÅ)rNrOr'r‹rêrër§rÚ smoothingrHÚ gradientsÚparametrizationsr°Úfeatsrr¡r„rtrÚ SequentialrÊrÅr=ÚhubÚload_state_dict_from_urlr%Údevicer¿Úwhitening_layerÚeval)rSr'r‹rêrërÅÚpolar_sÚcart_sÚrelative_orientationsÚparametrizationÚgradient_embeddingÚspatial_encodingÚwhitening_modelsrÄrTrr rOs@ ÿ ÿÿzMKDDescriptor.__init__ÚpatchescCs¸t|tƒstdt|ƒ›ƒ‚t|jƒdkstd|j›ƒ‚| |¡}| |¡}g}|j D]}|j | |j¡| |j ||ƒ¡q,tj|dd}tj|dd}|jdurZ| |¡}|S)NrVrWrXr-r:)rYr rZr[r\r]r^r÷rørùrúrBrþÚappendr=r_r»r¼rêrÿ)rSrÚgÚfeaturesrr/rrr rc5s zMKDDescriptor.forwardcCs6|jj›d|j›d|j›d|j›d|j›d|j›dS)Nr}z, kernel_type=z, whitening=z, training_set=rçr~)rUrer'r‹rêrërÅrRrrr rfPs ÿþýüûÿzMKDDescriptor.__repr__)r&r$rÖrérÀ)rerhrirjrrkrOr rcrfrlrrrTr rèäs, úþýüûúù2rèrëcCs&tjjt|t d¡d}||}|S)zLoad whitening model.rórô)r=rürýr%rþ)r‹rërrÄrrr Úload_whitening_model[src sXeZdZdZ ddeded ed ededd f‡fdd„ Zdedefdd„Z‡Z S)ÚSimpleKDz+Example to write custom Kernel Descriptors.r&r#rÖrérÀr'r‹rêrërÅr(Nc sˆtƒ ¡|dk}d|d}||_td||fdƒ}tƒ} t||d} t||| jjd}t |t ||ƒ|j|d}t || | ||¡|_dS) Nr#rìrírîrðrñròrö)rNrOr'rrHrr¡r„rtr¿rr°rrûr) rSr'r‹rêrërÅr‚r§r÷røÚoriÚeseÚwhrTrr rOes ÿzSimpleKD.__init__r.cCs | |¡Srd)rrærrr rc}s zSimpleKD.forward)r&r#rÖrérÀ) rerhrirjrrkrOr rcrlrrrTr r bs*úþýüûúùr )r&)0Útypingrrrrrr=Útorch.nn.functionalrÚ functionalr»Úkornia.constantsrÚkornia.corer r rrr Úkornia.filtersrrÚkornia.geometry.conversionsrÚkornia.utilsrrr€Ú__annotations__rrrrrkr%rr4rGÚModulerHrmrr r¡r¿rèrr rrrr Ús8 þ .F9jrw