<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0" xmlns:media="http://search.yahoo.com/mrss/"><channel><title><![CDATA[Datary Blog]]></title><description><![CDATA[Data for humans]]></description><link>https://blog.datary.io/</link><image><url>https://blog.datary.io/favicon.png</url><title>Datary Blog</title><link>https://blog.datary.io/</link></image><generator>Ghost 3.11</generator><lastBuildDate>Sun, 01 Mar 2026 00:25:36 GMT</lastBuildDate><atom:link href="https://blog.datary.io/rss/" rel="self" type="application/rss+xml"/><ttl>60</ttl><item><title><![CDATA[¿Por qué en (muchas) ocasiones la mediana es mejor que la media?]]></title><description><![CDATA[<p>En primavera de 2018 estuve en una charla de negocio en Valencia en la que - de media - los asistentes teníamos un patrimonio de más de 50 millones de euros. ¡Nada mal eh!</p><p>¿Cómo es eso posible?</p><p>¿Acaso era una reunión del club Bildelberg?</p><p>¿El Foro Económico Mundial se</p>]]></description><link>https://blog.datary.io/por-que-en-muchas-ocasiones-la-mediana-es-mejor-que-la-media/</link><guid isPermaLink="false">5da61f3cc06d640001eb7560</guid><dc:creator><![CDATA[Dani Jadraque]]></dc:creator><pubDate>Thu, 17 Oct 2019 04:30:00 GMT</pubDate><media:content url="https://blog.datary.io/content/images/2019/10/business_event.jpeg" medium="image"/><content:encoded><![CDATA[<img src="https://blog.datary.io/content/images/2019/10/business_event.jpeg" alt="¿Por qué en (muchas) ocasiones la mediana es mejor que la media?"><p>En primavera de 2018 estuve en una charla de negocio en Valencia en la que - de media - los asistentes teníamos un patrimonio de más de 50 millones de euros. ¡Nada mal eh!</p><p>¿Cómo es eso posible?</p><p>¿Acaso era una reunión del club Bildelberg?</p><p>¿El Foro Económico Mundial se desplazó de Davos a Valencia aquel año?</p><p>No. Nada de eso. Entre los aproximadamente 80 asistentes había estudiantes y emprendedores mayoritariamente. Dos de los grupos poblacionales con posiblemente menor patrimonio.</p><p>¿Entonces cómo es posible semejante media?</p><p>Pues por el simple hecho de que el ponente era Juan Roig, presidente de la cadena de supermercados Mercadona, que con un patrimonio estimado - según Forbes - de 4.005 millones de euros, disparaba la media patrimonial de todos los asistentes al evento.</p><p>La media es un indicador genial para conocer la tendencia central o promedio de una muestra grande de valores en la que no hay desviaciones importantes. Por ejemplo, <a href="https://blog.datary.io/que-es-la-media/">las estadísticas de Manu Ginobili durante su paso por la NBA</a> o la altura media de la población.</p><!--kg-card-begin: html--><p></p>
<iframe title="Altura media hombres a los 18 a&ntilde;os, en 1996" aria-label="Europe choropleth map" id="datawrapper-chart-6RGDG" src="//datawrapper.dwcdn.net/6RGDG/1/" scrolling="no" frameborder="0" style="width: 0; min-width: 100% !important; border: none;" height="400"></iframe><script type="text/javascript">!function(){"use strict";window.addEventListener("message",function(a){if(void 0!==a.data["datawrapper-height"])for(var e in a.data["datawrapper-height"]){var t=document.getElementById("datawrapper-chart-"+e)||document.querySelector("iframe[src*='"+e+"']");t&&(t.style.height=a.data["datawrapper-height"][e]+"px")}})}();</script>
<p></p><!--kg-card-end: html--><p>Sin embargo, cuando la muestra tiene un tamaño reducido y/o cuando sea posible encontrarse con valores disparatados, siempre vas a preferir la mediana como indicador para entender la tendencia central de la muestra.</p><p>Ambos casos se daban en el evento. El número de asistentes, es decir, el tamaño de la muestra era relativamente pequeño, 80 personas; y entre ellas se encontraba una de las personas con más patrimonio del país.</p><p>Si en lugar de la media te hubiera dado el valor de la mediana, en ningún caso hubieras pensado que asistí a un evento super exclusivo para grandes magnates, sino que hubieras tenido una idea mucho más cercana a la realidad sobre los asistentes al evento. Y justo de eso se trata, de intentar describir de la manera más fiable posible, un conjunto de valores con un único indicador.</p><p>Pero dejémonos de rollos y vamos a lo que de verdad interesa: ¿cómo se calcula la mediana?</p><p>Pues muy sencillo.</p><p>La mediana se calcula ordenando todos los datos de la muestra - de menor a mayor o viceversa, lo que más rabia te dé - y eligiendo el valor central para describir al conjunto entero.</p><p>En caso de que el tamaño de la muestra sea par, como en el caso del evento (80 personas), habrá dos valores centrales (los puestos 40 y 41 de la lista ordenada de patrimonios). En ese caso la mediana es igual a la media de valores de esos dos valores centrales.</p><p>Lo dicho, en un evento con mayoría de estudiantes y emprendedores, dudo mucho que la mediana de patrimonios de los asistentes hubiera estado muy por encima de los 10.000€.</p><p>¡Vaya diferencia entre 10.000€ y 50 millones eh!</p><p>Lo dicho, cuando te vayan a ofrecer un indicador para describir un conjunto de valores, piénsate muy bien si necesitas la mediana o la media. Porque la diferencia entre ambas puede ser abismal.</p>]]></content:encoded></item><item><title><![CDATA[No es lo mismo la media geométrica que la aritmética]]></title><description><![CDATA[<p>Corre el año 1977 en Madrid y, en pleno debate del proyecto de Constitución, el Presidente del Senado de España tiene que llamar al orden al senador Camilo José Cela por estar dormido en su escaño. Cela contesta a la reprimenda indicando que no está dormido sino durmiendo. Y preguntado</p>]]></description><link>https://blog.datary.io/media-geometrica-vs-media-aritmetica/</link><guid isPermaLink="false">5da47189c06d640001eb7479</guid><dc:creator><![CDATA[Dani Jadraque]]></dc:creator><pubDate>Tue, 15 Oct 2019 04:30:00 GMT</pubDate><media:content url="https://blog.datary.io/content/images/2019/10/cela_no_es_lo_mismo-2.jpg" medium="image"/><content:encoded><![CDATA[<img src="https://blog.datary.io/content/images/2019/10/cela_no_es_lo_mismo-2.jpg" alt="No es lo mismo la media geométrica que la aritmética"><p>Corre el año 1977 en Madrid y, en pleno debate del proyecto de Constitución, el Presidente del Senado de España tiene que llamar al orden al senador Camilo José Cela por estar dormido en su escaño. Cela contesta a la reprimenda indicando que no está dormido sino durmiendo. Y preguntado si acaso no son lo mismo, zanja: "Pues, no. Como no es igual estar jodido que estar jodiendo".</p><p>Como en la anécdota anterior, no te dejes confundir por el hecho de que la media aritmética y la media geométrica se llamen de forma parecida, porque no son para nada lo mismo.</p><p>Recordamos <a href="https://blog.datary.io/que-es-la-media/">en un post anterior Manu Ginobilli nos ayudaba a calcular la media aritmética</a> como la suma de todos los números de un conjunto, dividido entre el número de elementos del mismo. Es decir:</p><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/content/images/2019/10/CodeCogsEqn-2.png" class="kg-image" alt="No es lo mismo la media geométrica que la aritmética"></figure><p>Por su parte, la media geométrica se calcula como el producto de todos los números de un conjunto, elevado al inverso del número de elementos del mismo. O sea:</p><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/content/images/2019/10/CodeCogsEqn-6-.png" class="kg-image" alt="No es lo mismo la media geométrica que la aritmética"></figure><p>Ambas se diferencian igualmente en su uso. Será la media geométrica la que empleemos cuando queramos calcular el promedio de un conjunto de variaciones porcentuales.</p><p>¿Cuándo vas a necesitar calcular promedios de variaciones porcentuales me preguntas? Pues, por ejemplo, cuando calcules la variación interanual de una inversión.</p><p>¿Qué pasa si aplicas la media aritmética para calcular una variación porcentual? Pues que la lías. Ojo al siguiente ejemplo:</p><p>Imaginemos que el 1 de junio de 2012, una vez superado lo peor de la crisis financiera, se me hubiera ocurrido la estúpida idea de invertir 1000€ en el Deutsche Bank. Ya sabéis, <em>too big to fail</em> y todo eso. ¿Qué podría salir mal?</p><p>Así cotizó la acción durante los siguientes años:</p><!--kg-card-begin: html--><p></p>
<iframe title="Cotizaci&oacute;n Deutsche Bank" aria-label="Interactive line chart" id="datawrapper-chart-Afh9b" src="//datawrapper.dwcdn.net/Afh9b/1/" scrolling="no" frameborder="0" style="width: 0; min-width: 100% !important; border: none;" height="400"></iframe><script type="text/javascript">!function(){"use strict";window.addEventListener("message",function(a){if(void 0!==a.data["datawrapper-height"])for(var e in a.data["datawrapper-height"]){var t=document.getElementById("datawrapper-chart-"+e)||document.querySelector("iframe[src*='"+e+"']");t&&(t.style.height=a.data["datawrapper-height"][e]+"px")}})}();</script>
<p></p>
<p></p><!--kg-card-end: html--><p>¡Cagada monumental! De los 1000€ que invertí solo me quedan 250,49€.</p><p>Pero, ¿qué pérdida porcentual he sufrido de media cada año?</p><!--kg-card-begin: html--><p></p>
<iframe title="Variaci&oacute;n interanual de la cotizaci&oacute;n y de mi inversi&oacute;n" aria-label="Table" id="datawrapper-chart-onI2V" src="//datawrapper.dwcdn.net/onI2V/1/" scrolling="no" frameborder="0" style="width: 0; min-width: 100% !important; border: none;" height="253"></iframe><script type="text/javascript">!function(){"use strict";window.addEventListener("message",function(a){if(void 0!==a.data["datawrapper-height"])for(var e in a.data["datawrapper-height"]){var t=document.getElementById("datawrapper-chart-"+e)||document.querySelector("iframe[src*='"+e+"']");t&&(t.style.height=a.data["datawrapper-height"][e]+"px")}})}();</script>
<p></p>
<p></p><!--kg-card-end: html--><p>Si lo calculo con la media aritmética me sale que he perdido un 14,56% de media cada año.</p><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/content/images/2019/10/CodeCogsEqn-1--1.png" class="kg-image" alt="No es lo mismo la media geométrica que la aritmética"></figure><p>Sin embargo, si lo calculo con la media geométrica el resultado es peor, perdiendo un -17,94% de media cada año</p><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/content/images/2019/10/CodeCogsEqn-2-.png" class="kg-image" alt="No es lo mismo la media geométrica que la aritmética"></figure><hr><p>¿Qué ha pasado? ¿Cuál de las 2 es correcta?</p><p>Podemos comprobarlo aplicando el resultado medio obtenido en ambos casos por mis 1000€ de inversión y ver cual de los dos llega al resultado real de 250,49€ que realmente me quedan. Pues bien:</p><ul><li>Con la media aritmética:</li></ul><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/content/images/2019/10/CodeCogsEqn-9-.png" class="kg-image" alt="No es lo mismo la media geométrica que la aritmética"></figure><ul><li>Con la media geométrica:</li></ul><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/content/images/2019/10/CodeCogsEqn-8-.png" class="kg-image" alt="No es lo mismo la media geométrica que la aritmética"></figure><p>Como se puede observar, aplicar la media aritmética para calcular el promedio de variaciones percentuales nos habría llevado, en este caso, a un error del 33% frente al valor real.</p><p>Así que andaos con mucho ojo al aplicar una media u otra para hacer promedios porque, recordad, ¡no es lo mismo estar jodido que estar jodiendo!</p>]]></content:encoded></item><item><title><![CDATA[Entendiendo la media aritmética]]></title><description><![CDATA[<p>Si te gusta el baloncesto quizá te suene el nombre de Manudo, de Manudona o simplemente de Manu Ginobili. Le llamen como le llamen, hablamos posiblemente del mejor jugador de baloncesto que ha dado Argentina en su historia. Durante su dilatada carrera en la NBA promedió unos muy razonables 13.</p>]]></description><link>https://blog.datary.io/que-es-la-media/</link><guid isPermaLink="false">5d9b4fa9af634a0001e55d44</guid><dc:creator><![CDATA[Dani Jadraque]]></dc:creator><pubDate>Thu, 10 Oct 2019 04:30:00 GMT</pubDate><media:content url="https://blog.datary.io/content/images/2019/10/manudo.png" medium="image"/><content:encoded><![CDATA[<img src="https://blog.datary.io/content/images/2019/10/manudo.png" alt="Entendiendo la media aritmética"><p>Si te gusta el baloncesto quizá te suene el nombre de Manudo, de Manudona o simplemente de Manu Ginobili. Le llamen como le llamen, hablamos posiblemente del mejor jugador de baloncesto que ha dado Argentina en su historia. Durante su dilatada carrera en la NBA promedió unos muy razonables 13.3 puntos, 3.5 rebotes y 3.8 asistencias por partido.</p><p>¿Te has dado cuenta de qué acaba de pasar?</p><p>Te he resumido una carrera de 16 años como profesional, con todo su sufrimiento, tensión y esfuerzo en 3 meras cifras.</p><p>¡Esa es la magia de la media!</p><figure class="kg-card kg-image-card kg-card-hascaption"><img src="https://blog.datary.io/content/images/2019/10/image.png" class="kg-image" alt="Entendiendo la media aritmética"><figcaption>Las estadísticas medias de Manudo durante sus 16 temporadas en los San Antonio Spurs.</figcaption></figure><p>La media es un buen punto de partida para intentar entender cualquier conjunto de datos como, por ejemplo, las estadísticas de un jugador profesional de baloncesto.</p><p>Puede que no hayas visto jugar a Manu Ginobili nunca jamás. ¡Aún más! Puede que no hayas visto un partido de baloncesto en tu vida. Sin embargo, si te digo que durante la temporada 2007/2008, en el punto álgido de su carrera, el sr. Ginobili promedió unos nada desdeñables 19.5 puntos, 4.8 rebotes y 4.5 asistencias frente a los 9.0, 2.5 y 2.7 que promediaron, de media, los otros 200 jugadores que jugaban en su misma posición ese año, puedes perfectamente llegar a la conclusión (certera) de que estamos hablando de un auténtico crack.</p><p>Ahora bien, ¿cómo se calcula la media?</p><p>Para calcular la media de un conjunto de números, basta con sumar todos los números del conjunto y dividirlos por el número total de elementos.</p><p>¿Confundido?</p><p>Vamos pasito a paso y verás que lo entiendes en seguida. </p><!--kg-card-begin: html--><iframe title aria-label="Table" id="datawrapper-chart-hOk5T" src="//datawrapper.dwcdn.net/hOk5T/2/" scrolling="no" frameborder="0" style="width: 0; min-width: 100% !important; border: none;" height="703"></iframe><script type="text/javascript">!function(){"use strict";window.addEventListener("message",function(a){if(void 0!==a.data["datawrapper-height"])for(var e in a.data["datawrapper-height"]){var t=document.getElementById("datawrapper-chart-"+e)||document.querySelector("iframe[src*='"+e+"']");t&&(t.style.height=a.data["datawrapper-height"][e]+"px")}})}();</script><p></p><!--kg-card-end: html--><p>Lo primero de todo es tomar un conjunto de números. Para nuestro ejemplo, de la base de datos pública oficial de la NBA, hemos sacado la tabla de arriba con el número de puntos medios anotados por Ginobili en cada una de las 16 temporadas que jugó allí.</p><p>Ahora, si seguimos paso a paso la fórmula descrita anteriormente para la media, lo primero será "sumar todos los números del conjunto". Es decir, sumar 7.6, más 12.8, etc, etc, que nos da un total de 210.4.</p><p>El siguiente paso es dividir éste número por "el número total de elementos", es decir, en nuestro ejemplo, el número total de temporadas NBA de Ginobili: 16. Así pues nos sale que en una temporada media anotó 13.15 puntazos. ¡Ni tan mal!</p><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/content/images/2019/10/CodeCogsEqn-1-.png" class="kg-image" alt="Entendiendo la media aritmética"></figure><p>Como habrás visto, la descripción en palabras puede resultar liosa. Por eso, se suelen utilizar fórmulas para describir ratios como la media.</p><p>La primera (y la segunda y la tercera) vez que ves una fórmula puede asustar. Pero si la analizas despacito verás que es fácil entender, de hecho, ¡mucho más fácil de entender que una descripción en palabras!</p><p>La fórmula de la media es la siguiente:</p><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/content/images/2019/10/CodeCogsEqn.png" class="kg-image" alt="Entendiendo la media aritmética"></figure><p>Como ves hay 2 tipos de elementos en la fórmula de la media: varias <strong>x</strong> en el numerador de la división (arriba) y una única <strong>n</strong> en el denominador (abajo).</p><ul><li>La <strong>x</strong> representa cada uno de los números del conjunto. En nuestro caso, cada uno de los promedios de puntos por temporada. Así el primer valor representa a los puntos de la primera temporada, que se suma a los puntos de la segunda temporada, ..., hasta terminar sumando los puntos de la última temporada que jugó Ginobili en la NBA antes de retirarse, es decir, la 2017/2018.</li><li><strong>n</strong> es el número de elementos del conjunto de números. En nuestro caso, de temporadas NBA de Ginobili que, si las cuentas, suman 16. ¡16 temporadas en la NBA! ¡Casi nada!</li></ul><hr><p>Si quieres seguir aprendiendo más estadística, los siguientes artículos son un buen próximo paso.</p><blockquote>Igual te habrás fijado que la media de puntos que hemos calculado con la fórmula 13.15 no es igual que la media de Ginobili durante toda su carrera que citábamos al principio 13.3. ¿Sabes por qué? Dale una vuelta y si no acabas de verlo tienes la respuesta aquí.</blockquote><blockquote>Además de la media aritmética que acabamos de ver, es posible que hayas oído alguna vez mencionada la media geométrica. Aunque las dos tengan un nombre parecido ¡no son lo mismo! Puedes aprender la diferencia aquí.</blockquote>]]></content:encoded></item><item><title><![CDATA[Las Fases que Definen un Modelo Predictivo]]></title><description><![CDATA[<p>“¿Y si pudiéramos predecir qué pasará mañana? ¿O pudiéramos saber qué decisión es, estadísticamente, más oportuna para mi empresa?”</p><p>Gracias a la tecnología, podemos: <strong><strong>a través de los modelos predictivos</strong></strong>.</p><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/wp-content/uploads/2018/03/Modelos-Predictivos.jpg" class="kg-image" alt="Modelos-Predictivos"></figure><p>Pero ¿qué es un modelo predictivo? Cuando hablamos de modelos predictivos nos estamos refiriendo a un <strong><strong>conjunto de técnicas de</strong></strong></p>]]></description><link>https://blog.datary.io/las-fases-que-definen-un-modelo-predictivo/</link><guid isPermaLink="false">5c0021a81743190001652d8f</guid><category><![CDATA[Analytics]]></category><dc:creator><![CDATA[Fernando Diaz]]></dc:creator><pubDate>Wed, 14 Mar 2018 17:27:00 GMT</pubDate><media:content url="https://blog.datary.io/content/images/2019/08/Cabecera-modelo-predictivo.png" medium="image"/><content:encoded><![CDATA[<img src="https://blog.datary.io/content/images/2019/08/Cabecera-modelo-predictivo.png" alt="Las Fases que Definen un Modelo Predictivo"><p>“¿Y si pudiéramos predecir qué pasará mañana? ¿O pudiéramos saber qué decisión es, estadísticamente, más oportuna para mi empresa?”</p><p>Gracias a la tecnología, podemos: <strong><strong>a través de los modelos predictivos</strong></strong>.</p><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/wp-content/uploads/2018/03/Modelos-Predictivos.jpg" class="kg-image" alt="Las Fases que Definen un Modelo Predictivo"></figure><p>Pero ¿qué es un modelo predictivo? Cuando hablamos de modelos predictivos nos estamos refiriendo a un <strong><strong>conjunto de técnicas de análisis estadístico</strong></strong> gracias a las cuáles podemos anticipar o prever situaciones futuras.</p><p>Entre otros campos, los modelos predictivos llevan años utilizándose en la industria financiera como base para el trading algorítmico.</p><blockquote>Sad photo of Wall Street traders reacting as stock market plunges. <a href="https://t.co/671pG4Db4L">pic.twitter.com/671pG4Db4L</a>— Binyamin Appelbaum (@BCAppelbaum) <a href="https://twitter.com/BCAppelbaum/status/960614104552689665?ref_src=twsrc%5Etfw">5 de febrero de 2018</a></blockquote><p>Sin embargo, tienen todavía muy poca repercusión en otras industrias donde ese conocimiento aventajado, resultaría muy útil para, por ejemplo, aumentar las ventas.</p><p>Para que entiendas cómo funcionan los modelos productivos en detalle y puedas decidir si aplicarlos en tu campo de negocio, me gustaría explicarte cuáles son las fases que lo componen.</p><p>¡Empecemos!</p><h2 id="c-mo-se-crea-un-modelo-predictivo"><strong><strong>Cómo se crea un modelo predictivo</strong></strong></h2><p>Los modelos predictivos se crean en base a 4 fases de trabajo:</p><h4 id="fase-1-obtenci-n-de-los-datos"><strong><strong>Fase 1: Obtención de los Datos</strong></strong></h4><p>La primera fase de un modelo predictivo se centra en la obtención de datos, cuantos más mejor. Sin embargo, no podemos equivocarnos: <strong><strong>no nos vale cualquier cosa</strong></strong>.</p><p>Para que nuestro modelo predictivo sea eficaz, es imprescindible que las series de datos que adquiramos sean:</p><ul><li><strong><strong>Históricas</strong></strong>: para poder aprender cómo se ha comportado un registro durante largos periodos de tiempo.</li><li><strong><strong>Actualizadas</strong></strong>: para poder comparar los datos reales con nuestras predicciones y así poder corregir el error y mejorar progresivamente el desempeño de nuestro modelo.</li><li><strong><strong>Homogéneas</strong></strong>: los datos se tienen que haber conseguido con metodologías de obtención uniformes, y por tanto los datos deben ser objetivos, para poder comparar variables entre sí.</li></ul><p>Este trabajo de búsqueda, documentación, formateo y limpiado de los datos suele ser el más tedioso de realizar. Es por ello que lo automatizamos desde <a href="https://www.datary.io/" rel="noopener"><strong><strong>Datary</strong></strong></a>, ofreciendo un catálogo de datos curados y listos para ser usados.</p><figure class="kg-card kg-image-card kg-card-hascaption"><img src="https://blog.datary.io/wp-content/uploads/2018/03/Onboarding_1_pantalla-1024x811.png" class="kg-image" alt="Las Fases que Definen un Modelo Predictivo"><figcaption>Open Data Market, plataforma de datos abiertos desarrollada por Datary.</figcaption></figure><h4 id="fase-2-evaluaci-n-de-dependencias"><strong><strong>Fase 2: Evaluación de Dependencias</strong></strong></h4><p>Si queremos predecir el resultado del próximo partido del F.C Barcelona, la variable “¿juega Messi?” tendrá mucha más influencia en nuestra predicción que la variable “nº de zurdos que hay en el campo”.</p><p>Lógico ¿no?</p><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/wp-content/uploads/2018/03/Messi-1024x576.jpg" class="kg-image" alt="Las Fases que Definen un Modelo Predictivo"></figure><p>Este es un ejemplo tonto, pero es clave para entender que, de cara a la realización de una predicción, <strong><strong>no todos los factores tienen la misma repercusión</strong></strong> en la ecuación final.</p><p>Igual de lógico, y también igual de relevante, es entender que no basta con analizar los resultados históricos del mismo hecho, sino que <strong><strong>es imprescindible analizar también todas aquellas nuevas variables</strong></strong> que puedan influir sobre el resultado de éste.</p><p>Sino lo entendemos así, cometeremos un error muchas veces repetido por otros en el pasado…</p><ul><li><strong><strong>“<a href="https://www.forbes.com/sites/gregsatell/2014/09/05/a-look-back-at-why-blockbuster-really-failed-and-why-it-didnt-have-to/#23a62ac1d64a" rel="noopener">Do you know anyone using Netflix?</a>“. </strong></strong></li><li><strong><strong>“<a href="http://digitalcommunications.wp.st-andrews.ac.uk/2015/03/05/whats-the-value-in-pixels-the-ethos-of-digital-change/" rel="noopener">Investor concern over the thread of new technologies is overstated</a>“, Blockbuster analyst report 1999.</strong></strong></li></ul><figure class="kg-card kg-image-card kg-card-hascaption"><img src="https://blog.datary.io/wp-content/uploads/2018/03/Netflix-Blockbuster.jpeg" class="kg-image" alt="Las Fases que Definen un Modelo Predictivo"><figcaption>El crecimiento de Netflix (y la caída de Blockbuster). / Drift</figcaption></figure><p>En este sentido, imaginemos que queremos predecir los niveles de polen en España para la próxima primavera. Lo correcto sería no solo fijarnos en los niveles ambientales de polen a nivel histórico, sino también en variables como:</p><ul><li><strong><strong>La temperatura y precipitación</strong></strong>: que condicionan el momento de floración y, por tanto, el inicio de la temporada de polen.</li><li><strong><strong>La masa forestal</strong></strong>: ¿algún incendio ha desolado los bosques de la zona recientemente? Una catástrofe de ese tipo tiene muchos efectos secundarios, como por ejemplo la existencia de menos polen en el ambiente.</li></ul><figure class="kg-card kg-image-card kg-card-hascaption"><img src="https://blog.datary.io/wp-content/uploads/2018/03/Olivos.jpg" class="kg-image" alt="Las Fases que Definen un Modelo Predictivo"><figcaption><span class="s1" style="box-sizing: border-box; -webkit-font-smoothing: antialiased;"><em style="box-sizing: border-box; -webkit-font-smoothing: antialiased;">La cantidad de olivos que hay en Jaen, influye no sólo en su producción de aceite de oliva, sino también en los picos de niveles ambientales de Olea año a año</em></span>. / Cadenaser.com</figcaption></figure><ul><li><strong><strong>El viento</strong></strong>: responsable del transporte de las partículas de polen de unas zonas a otras.</li></ul><h4 id="fase-3-modelado"><strong><strong>Fase 3: Modelado</strong></strong></h4><p>Ya tenemos datos históricos, actualizados y homogéneos de aquellas variables que hemos determinado que van a influir en nuestra predicción. Ahora llega la hora de ejecutar el modelado estadístico.</p><p>Siguiendo con el ejemplo citado, el objetivo es definir una fórmula con la que obtengamos el número de partículas de polen en el aire, en función del valor que adquieran las otras variables que van a influir sobre la predicción.</p><p>¿Suena complejo, no? Realmente lo es.</p><p>De ahí que, en vez de reinventar la rueda con cada modelo predictivo, se haga uso de fórmulas ya definidas en el campo de la Estadística. <strong><strong>En función del tipo de datos y del tipo de dependencia funcional entre las variables que tengamos, aplicaremos una técnica de modelado predictivo u otra</strong></strong>.</p><p>Para conocer más sobre las técnicas de modelado predictivo, te recomendamos eches un vistazo a <a href="https://en.wikipedia.org/wiki/Predictive_modelling">este enlace</a>.</p><h4 id="fase-4-correcciones"><strong><strong>Fase 4: Correcciones</strong></strong></h4><p>Una vez definido nuestro modelo, es importante ir corrigiéndolo para que mejore progresivamente en el desempeño de la predicción.</p><p>Esta corrección <strong><strong>se podrá realizar de forma manual</strong></strong>, por ejemplo, definiendo nuevas dependencias funcionales, <strong><strong>o se podrá dotar al sistema de la capacidad de aprender por sí mismo</strong></strong> a ir corrigiendo su error. Esta última técnica se conoce con el – muy desgastado – nombre de Machine Learning.</p><figure class="kg-card kg-image-card kg-card-hascaption"><img src="https://blog.datary.io/wp-content/uploads/2018/03/Machine_Learning_StanfordMediaLab-1024x293.jpg" class="kg-image" alt="Las Fases que Definen un Modelo Predictivo"><figcaption>El Machine Learning, según Gartner, marcará una nueva era. / Berkeley Labs Media</figcaption></figure><p>Pero no nos liaremos más, y de <strong><strong>machine learning os hablaremos en detalle en futuros artículos</strong></strong>. Si te ha gustado éste, acuérdate de compartirlo y no dejes de comentarnos tus opiniones en la sección de comentarios.</p><p>¡Un abrazo!</p>]]></content:encoded></item><item><title><![CDATA[Web Scraping: qué es, legalidad, usos y el porqué de su valor diferencial]]></title><description><![CDATA[<p>El avance de las nuevas tecnologías ha supuesto una revolución absoluta en el campo de la creación de contenidos. <strong><strong>Cada persona es una fuente de información</strong></strong>.</p><p>Estos avances han conseguido que cada vez haya más y más datos de acceso público. Datos que se analizan, y de donde sacar conclusiones</p>]]></description><link>https://blog.datary.io/web-scraping-que-es-legalidad-usos-y-el-porque-de-su-valor-diferencial/</link><guid isPermaLink="false">5c001bf996d35a000107a560</guid><dc:creator><![CDATA[Fernando Diaz]]></dc:creator><pubDate>Wed, 07 Feb 2018 17:02:00 GMT</pubDate><media:content url="https://blog.datary.io/content/images/2019/08/Cabecera-web-scraping.png" medium="image"/><content:encoded><![CDATA[<img src="https://blog.datary.io/content/images/2019/08/Cabecera-web-scraping.png" alt="Web Scraping: qué es, legalidad, usos y el porqué de su valor diferencial"><p>El avance de las nuevas tecnologías ha supuesto una revolución absoluta en el campo de la creación de contenidos. <strong><strong>Cada persona es una fuente de información</strong></strong>.</p><p>Estos avances han conseguido que cada vez haya más y más datos de acceso público. Datos que se analizan, y de donde sacar conclusiones que apoyen o lleguen a ser la piedra angular de las estrategias empresariales hoy en día.</p><p>Uno de las técnicas con más peso en este proceso es la conocida como web scraping. Pero, <strong><strong>¿qué es el web scraping?</strong></strong></p><p>Como otras muchas, es una táctica que ha adquirido mayor relevancia en los últimos años; sin embargo, <strong><strong>sigue habiendo mucho desconocimiento al respecto de sus posibilidades, limitaciones o implicaciones legales</strong></strong>.</p><p>Espero, con este artículo, poner un poco de luz en relación al web scraping, y ayudar con ello a clarificar la información acerca de una táctica que por si misma es perfectamente legal. Y que, utilizada tras el diseño de una acertada estrategia, puede aportar a las empresas <strong><strong>un gran valor diferencial</strong></strong>.</p><h2 id="web-scraping-qu-es-y-sus-or-genes">Web Scraping: qué es y sus orígenes</h2><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/wp-content/uploads/2018/02/Web_Scraping_Datary.jpg" class="kg-image" alt="Web Scraping: qué es, legalidad, usos y el porqué de su valor diferencial"></figure><p>El Web Scraping es el conjunto de acciones ejecutadas por programas de software dirigidas a la extracción de grandes cantidades de datos de sitios web. Gracias a estos programas podemos <strong><strong>automatizar la obtención de información</strong></strong>, y hacerlo de un modo rápido, seguro y sin fallos. Para entender como surgieron, echemos un vistazo atrás en el tiempo.</p><h4 id="origen-del-web-crawling-al-web-scraping">Origen: Del Web Crawling al Web Scraping</h4><p>El web scraping nace de la mano de internet. Con el objetivo de organizar toda la información disponible en la red, los primeros motores de búsqueda (WebCrawler, Lycos, Excite!, Altavista) desarrollaron lo que se conocen como web crawlers: <strong><strong>robots para rastrear todas las páginas webs existentes</strong></strong>.</p><p>Estos crawlers o spiders rastreaban internet, indizaban la información y esto permitía a los buscadores poder ofrecer a sus usuarios la información que necesitaban, dirigiéndoles a la web oportuna.</p><p>Por supuesto, esta es la base sobre la que se asientan los actuales buscadores, como Google, Bing, o Yahoo!.</p><p>Una vez entendido el web crawler, damos un paso más, y nos encontramos con el web scraping. Al igual que el web crawling rastrea para indexar y clasificar, el web scraping va un poco más allá y utiliza sus <strong><strong>spiders para extraer la información, y almacenarla en el formato que necesitemos</strong></strong>, para su posterior análisis.</p><h4 id="d-nde-radica-su-valor">Dónde Radica Su Valor</h4><p>Sin embargo, no pensemos que la extracción en sí misma es el gran valor del web scraping. Su verdadera utilidad surge de la unión de los datos extraídos, en muchas ocasiones de varias fuentes, el posterior análisis, y la obtención final de conclusiones. Unas conclusiones que son <strong><strong>verdadera inteligencia de cara a nuestra estrategia de negocio</strong></strong>, a los esfuerzos en marketing, o al desarrollo del último producto.</p><p>De este modo, decenas de e-commerce saben el precio de los productos fijados por la competencia; webs de noticias conocen cuáles son los contenidos que mejor funcionan en otras webs; o los bancos de inversión obtienen información para saber donde colocar su capital.</p><h2 id="-el-web-scraping-es-legal">¿El Web Scraping es legal?</h2><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/wp-content/uploads/2018/02/Web_Scraping_Legal_Datary.jpg" class="kg-image" alt="Web Scraping: qué es, legalidad, usos y el porqué de su valor diferencial"></figure><p>Si. El web scraping en sí, es legal. De hecho, es importante que entendamos que el problema no está en el uso de los crawlers para rastrear la red, sino en el uso que damos de los datos conseguidos. Es por ello, que <strong><strong>en España el web scraping es legal</strong></strong>, excepto para su uso en varios escenarios bien definidos:</p><ul><li>A nivel de competencia, si con el scrapeo incurrimos en competencia desleal para con la web scrapeada, generando una duda razonable en el consumidor. Por ejemplo, si con dicha extracción se usa la reputación de la web escrapeada para favorecer la web que usa los contenidos no propios.</li><li>Si estamos incurriendo en un delito desde el punto de vista de la propiedad intelectual.</li><li>Dentro del marco de la Ley Orgánica de Protección de Datos (LOPD), cuando accedemos a datos de terceros sobre los que no se tiene consentimiento para su almacenamiento o tratamiento.</li></ul><p>Para conocer más acerca de estos supuestos, creo que es muy interesante el artículo “<a href="https://diariodeuneletrado.wordpress.com/2017/03/22/es-legal-el-web-scrapping-de-webscrapping-y-legalidad/" rel="noopener">¿Es legal el Web Scraping?: de web scraping y legalidad</a>” del abogado especializado en nuevas tecnologías <a href="https://www.linkedin.com/in/rub%C3%A9n-v%C3%A1zquez-romero-703a1027/" rel="noopener">Rubén Vazquez</a>.</p><h4 id="fuera-de-espa-a">Fuera de España</h4><p>Si hablamos de esta práctica en otros mercados, o sobre plataformas de origen extranjero, las circunstancias se complican. Cada caso es un mundo.</p><p>Lo que si parece claro en ciertos mercados es que las grandes plataformas tratan de defender sus intereses, y el tratar de scrapear sus contenidos, <strong><strong>supondrá para las empresas que scrapean tener que enfrentarse a costosos procesos judiciales</strong></strong> que demuestren, en cada caso, que dicha extracción es acorde a ley. Interesante reflexión sobre este asunto por parte de <a href="https://twitter.com/edans" rel="noopener">Enrique Dans</a> en “<a href="https://www.enriquedans.com/2017/08/web-scraping-legal-ilegal-o-depende.html" rel="noopener">Web scraping: ¿legal, ilegal, o depende?</a>” (Publicado el 15/8/17).</p><h2 id="para-que-se-usa-el-web-scraping">Para que se usa el web scraping</h2><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/wp-content/uploads/2018/02/Web_Scraping_Usos_Datary.jpg" class="kg-image" alt="Web Scraping: qué es, legalidad, usos y el porqué de su valor diferencial"></figure><p>A continuación, listamos casos de uso que hemos llevado a cabo en <a href="https://datary.io/" rel="noopener">Datary</a>, pero también otros muchos que sabemos se realizan a diario en la red.</p><h4 id="estrategia-de-negocio-y-desarrollo-de-producto">Estrategia de Negocio y Desarrollo de Producto</h4><ul><li><em><strong><strong>Inteligencia de Negocio</strong></strong></em>: a través de la extracción de grandes cantidades de datos (por lo general, provenientes de varias fuentes), su posterior limpieza y filtrado, las empresas obtienen conclusiones que de otro modo les sería imposible conseguir. Con esta inteligencia, las decisiones de negocio y marketing deberían ser mucho mas coherentes y acertadas.</li><li><em><strong><strong>Para la Compra/Venta de Servicios o Productos</strong></strong></em>: en este caso, uno de los sectores que más utiliza el web scraping es la industria inmobiliaria. Analizando las propiedades a la venta en webs de terceros se definen estrategias de negocio y desarrollo de producto.</li><li><em><strong><strong>Análisis de las Reviews de Productos de tu Competencia</strong></strong></em>: conocer la opinión de nuestros potenciales clientes sobre productos que son competencia al nuestro nos ayudará en el desarrollo de producto, en como y cuando llegar al cliente, y nos mostrará nuevas oportunidades de negocio.</li></ul><h4 id="marketing-y-crecimiento">Marketing y Crecimiento</h4><ul><li><em><strong><strong>Estrategia de Contenidos</strong></strong></em>: a la hora de generar contenidos interesantes para los usuarios, es clave conocer sus gustos e inquietudes. El web scraping nos puede ayudar en este aspecto. Si analizamos los datos de visualización de las páginas que a priori son interesantes para nuestros potenciales usuarios, podremos saber cuáles son los contenidos que tenemos que crear.</li><li><em><strong><strong>Publicar Listados de Contenidos</strong></strong></em>: utilizamos la extracción para crear páginas con un listado resumido de los contenidos ofrecidos por terceros, pero siempre enlazando a las webs origen de la información. Es el caso de agregadores de información por verticales, y beneficia tanto al usuario final como a los creadores de contenidos, ya que supone una nueva fuente de tráfico.</li><li><em><strong><strong>Conocer las Tendencias del Momento</strong></strong></em>: analizando en medios sociales que es o no tendencia, podemos actuar una vez más sobre nuestra estrategia de producto, marketing o negocio.</li><li><em><strong><strong>El Copy Acertado</strong></strong></em>: podemos saber que verbos, o estructuras gramaticales llaman la atención de los lectores, analizando, por ejemplo, los títulos de los vídeos en YouTube con más de 1 millón de visualizaciones.</li><li><em><strong><strong>Páginas de comparación de precios</strong></strong></em>: una nuevo uso legal del web scraping es extraer el precio de productos que nosotros vendemos, pero en páginas de terceros. Con esos datos, creamos páginas comparativas para que los potenciales clientes vean un valor diferencial con respecto a la competencia. Es muy utilizado dentro del sector e-commerce.</li><li><em><strong><strong>Listado de eventos</strong></strong></em>: para extraer información sobre los eventos de un determinado vertical en un área geográfica.</li></ul><h4 id="otros-usos-interesantes">Otros Usos Interesantes</h4><ul><li><em><strong><strong>Documentación Pasada, Útil a Día de Hoy</strong></strong></em>: En abogacía, se usa el web scraping para conocer las circunstancias e información de casos pasados, y de este modo aplicar los conocimientos a los procesos en curso.</li><li><em><strong><strong>En Recursos Humanos:</strong></strong></em> se utiliza para analizar perfiles en redes sociales y así poder dar con candidatos idóneos para los puestos disponibles.</li></ul><h2 id="ventaja-competitiva-sustancial">Ventaja Competitiva Sustancial</h2><p>Tras analizar mucha información al respecto, y sobre todo, viendo lo que cada día nos solicitan nuevos clientes, de lo que si estamos seguros es del valor diferencial que ofrece el web scraping a las empresas que lo utilizan.</p><p>Sobre todo para aquellos que piensan más allá, y tratan de innovar en su uso.</p><p><strong><strong>Porque pone a nuestra disposición más y mejor información</strong></strong> que poder utilizar en nuestras estrategias; nos permite sacar <strong><strong>conclusiones directamente de las opiniones o acciones de nuestros clientes</strong></strong>; y aunque avanza rápido como la espuma, <strong><strong>su uso todavía es residual</strong></strong>, y por tanto, más que diferencial.</p><p>Cada vez hay más datos que son de acceso público, subidos por los propios usuarios, por lo que un inteligente y legal uso del web scraping ofrece sin duda una ventaja competitiva sustancial.</p><p>Cover Photo by <a href="https://www.flickr.com/photos/vek/7576982034/in/photolist-cxy1Mh-9rFXdv-9X8M3b-dXUUwp-qHcoLd-arfyDU-4VWqy6-9t43TT-9hBtzm-9wWLC1-8Thnfn-93nLdS-9H9o9s-8JN9g5-dXUUZc-aKNyLF-cbv54E-aK4sRM-4VWrbg-a1PNRp-9qb4CH-9qb67Z-bouff8-9JvZ1n-9ErHrM-bGURxk-9Vafoo-4VWzyP-9t421Z-9xFBJ9-8C6L4w-93nQR7-9q8pWq-8C3HtT-9bfMPS-4W1GZW-oGWcvB-93n5Pd-9So1qc-9EFUmh-4VXUXR-nDebaa-9Lihbj-4VXXaD-9gjkh1-4VWArR-9HUJfS-9EdD4A-9X2VDb-4VWpJX" rel="noopener">Kevin Spencer</a>.</p>]]></content:encoded></item><item><title><![CDATA[Bases de Datos Públicas]]></title><description><![CDATA[<p><br>El <a href="http://datary.io/2017/12/05/que-es-datary/" rel="noopener">objetivo último de Datary</a> es poner a disposición de <strong><strong>PYMEs</strong></strong>, <strong><strong>consultores</strong></strong> y <strong><strong>científicos de datos</strong></strong> (entre otros) la mayor cantidad de bases de datos de calidad, para que puedan <strong><strong>acceder a la información más relevante</strong></strong> de la manera más segura.</p><p>Desde un principio, teníamos muy claro que las bases</p>]]></description><link>https://blog.datary.io/bases-de-datos-publicas/</link><guid isPermaLink="false">5c0028381743190001652dba</guid><category><![CDATA[OpenDataMarket]]></category><dc:creator><![CDATA[Fernando Diaz]]></dc:creator><pubDate>Thu, 14 Dec 2017 17:56:00 GMT</pubDate><media:content url="https://blog.datary.io/content/images/2019/08/Cabecera-bbdd-publicas.png" medium="image"/><content:encoded><![CDATA[<img src="https://blog.datary.io/content/images/2019/08/Cabecera-bbdd-publicas.png" alt="Bases de Datos Públicas"><p><br>El <a href="http://datary.io/2017/12/05/que-es-datary/" rel="noopener">objetivo último de Datary</a> es poner a disposición de <strong><strong>PYMEs</strong></strong>, <strong><strong>consultores</strong></strong> y <strong><strong>científicos de datos</strong></strong> (entre otros) la mayor cantidad de bases de datos de calidad, para que puedan <strong><strong>acceder a la información más relevante</strong></strong> de la manera más segura.</p><p>Desde un principio, teníamos muy claro que las bases de datos públicas deberían ser accesibles en Datary, y facilitar de este modo el acceso a sus indicadores de la manera más sencilla: <strong><strong>vía API</strong></strong>.</p><p>Por ello, a continuación os mostramos cuáles son las bases de datos públicas que ya están disponibles y en las que puedes navegar al registrarte en <a href="https://datary.io/signup" rel="noopener">Datary.io</a>, así como los indicadores más relevantes que recogen, y el __uuid__ (su identificador único, con el que podréis acceder a las mísmas) de cada una de ellas .</p><h2 id="listado-de-bases-de-datos-p-blicas">Listado de Bases de Datos Públicas</h2><p>— <a href="https://blog.datary.io/2017/12/14/bases-de-datos-publicas/#unique-identifier-1">Instituto Nacional de Estadística (INE)</a></p><p>— <a href="https://blog.datary.io/2017/12/14/bases-de-datos-publicas/#unique-identifier-2">Oficina Europea de Estadística (Eurostat)</a></p><p>— <a href="https://blog.datary.io/2017/12/14/bases-de-datos-publicas/#unique-identifier-3">Comisión Nacional de Mercados y Competencia (CNMC)</a></p><p>— <a href="https://blog.datary.io/2017/12/14/bases-de-datos-publicas/#unique-identifier-4">Centro de Investigaciones Sociológicas (CIS)</a></p><p>— <a href="https://blog.datary.io/2017/12/14/bases-de-datos-publicas/#unique-identifier-5">Google Consumer Barometer (GCB)</a></p><p>— <a href="https://blog.datary.io/2017/12/14/bases-de-datos-publicas/#unique-identifier-6">Organización para la Cooperación y el Desarrollo Económicos (OCDE)</a></p><p>— <a href="https://blog.datary.io/2017/12/14/bases-de-datos-publicas/#unique-identifier-7">European Union Intellectual Property Office (EUIPO)</a></p><p>— <a href="https://blog.datary.io/2017/12/14/bases-de-datos-publicas/#unique-identifier-8">Canadian Intellectual Property Office (CIPO)</a></p><p>— <a href="https://blog.datary.io/2017/12/14/bases-de-datos-publicas/#unique-identifier-9">United States Patent and Trademark Office (USPTO)</a></p><p>— <a href="https://blog.datary.io/2017/12/14/bases-de-datos-publicas/#unique-identifier-10">Oficina Española de Patentes y Marcas (OEPM)</a></p><hr><h3 id="instituto-nacional-de-estad-stica-ine-"><a href="https://datary.io/ine" rel="noopener">Instituto Nacional de Estadística (INE)</a></h3><p>El <a href="https://ine.es/" rel="noopener">Instituto Nacional de Estadística (INE)</a> es el organismo español encargado de la coordinación, realización, y supervisión técnica de los indicadores estadísticos de la demografía, economía y sociedad españolas.</p><!--kg-card-begin: markdown--><p align="center">
 <img alt="Bases de Datos Públicas" src="https://blog.datary.io/content/images/2019/07/ine-building-image-2.jpg" style="width: 400px; height:300px">
</p><!--kg-card-end: markdown--><p>El INE fue creado a raíz de la Ley del 31 de diciembre de 1945, y entre los muchos indicadores que recoge, destacan el:</p><p>— Indice de Precios de Consumo (IPC), elaborado mensualmente.</p><p>— Padrón Municipal.</p><p>— Indice de Precios de la Vivienda (IPV).</p><p>— Hipotecas.</p><p>— Población activa (indicador trimestral)</p><p>— Coyuntura Turística Hotelera</p><p>Conoce <a href="https://datary.io/blog/2017/12/15/instituto-nacional-de-estadistica-ine/" rel="noopener">todo sobre el INE</a> y los indicadores recogidos por esta institución <a href="https://datary.io/blog/2017/12/15/instituto-nacional-de-estadistica-ine/" rel="noopener">aquí</a>.</p><p>El __uuid__, indicador único para acceder al INE vía API en Datary, es el:</p><p><strong><strong>uuid: b71fb2a2-3a0a-437e-8479-d7044b42f0a3</strong></strong></p><p>Actualización de los datos del INE: <strong><strong>A diario</strong></strong>.</p><h3 id="oficina-europea-de-estad-stica-eurostat-"><a href="https://datary.io/eurostat" rel="noopener">Oficina Europea de Estadística (Eurostat)</a></h3><p>La Oficina Europea de Estadística (Eurostat) es el organismo responsable de la obtención los indicadores estadísticos más relevantes de la Unión Europea. Asimismo, promueve dentro de los estados miembros la armonización de los métodos estadísticos.</p><!--kg-card-begin: markdown--><p align="center">
 <img alt="Bases de Datos Públicas" src="https://blog.datary.io/content/images/2019/07/eurostat-building-image-1.jpg" style="width: 400px; height:300px">
</p><!--kg-card-end: markdown--><p>Publica los datos macro-económicos y regionales que orientan las políticas estructurales de la Unión Europea. Realiza sus trabajos en base a 9 áreas temáticas principales:</p><p>— Estadísticas generales y regionales.</p><p>— Economía y finanzas.</p><p>— Población y condiciones sociales.</p><p>— Industria, comercio y servicios.</p><p>— Agricultura y pesca.</p><p>— Comercio exterior.</p><p>— Transportes.</p><p>— Ambiente y energía.</p><p>— Ciencia y tecnología.</p><p>El __uuid__, indicador único para acceder al Eurostat vía API en Datary, es el:</p><p><strong><strong>uuid: d95cb9fa-7065-4a1d-9e98-3b65bb114a0d</strong></strong></p><p>Actualización de los datos del Eurostat: <strong><strong>A diario</strong></strong>.</p><h3 id="comisi-n-nacional-de-mercados-y-competencia-cnmc-"><a href="https://datary.io/cnmc" rel="noopener">Comisión Nacional de Mercados y Competencia (CNMC)</a></h3><p>Organismo adscrito al Ministerio de Economía y Competitividad, tiene la responsabilidad de preservar, garantizar y promover el correcto funcionamiento, la transparencia y la existencia de una competencia efectiva en todos los mercados y sectores productivos, en beneficio de los consumidores y usuarios.</p><!--kg-card-begin: markdown--><p align="center">
 <img alt="Bases de Datos Públicas" src="https://blog.datary.io/content/images/2019/07/cnmc-building-image.jpg" style="width: 400px; height:300px">
</p><!--kg-card-end: markdown--><p>Su papel de control y regulación le hace fuente de datos de gran relevancia en todos los sectores productivos, haciendo especial hincapié en materia energética,  telecomunicaciones y audiovisual, ámbito aeroportuario y ferroviario, y el mercado postal.</p><p>El __uuid__, indicador único para acceder a los datos de la CNMC vía API en Datary, es el:</p><p><strong><strong>uuid: 62cecc43-bab1-44bd-8273-16d788b43e24</strong></strong></p><p>Actualización de los datos de la CNMC: <strong><strong>Mensual</strong></strong>.</p><h3 id="centro-de-investigaciones-sociol-gicas-cis-"><a href="https://datary.io/cis" rel="noopener">Centro de Investigaciones Sociológicas (CIS)</a></h3><p>Entidad autónoma responsable del estudio científico de la sociedad española a través de encuestas periódicas. Dependiente del Ministerio de la Presidencia para las Administraciones Territoriales, realiza dichas encuestas por iniciativa propia o por solicitud de otros organismos nacionales o comunitarios.</p><!--kg-card-begin: markdown--><p align="center">
 <img alt="Bases de Datos Públicas" src="https://blog.datary.io/content/images/2019/07/cis-building-image.jpg" style="width: 400px; height:300px">
</p><!--kg-card-end: markdown--><p>Destaca la labor del CIS, por su trabajo en la realización del:</p><p>— Barómetro, encuesta mensual que recoge la opinión de los españoles en materia económica, política, de Gobierno/Oposición, y en clave electoral. Por otro lado, también muestra la autoubicación ideológica de los ciudadanos y su percepción de los principales problemas de España.</p><p>— Indicador de Confianza del Consumidor, donde se recoge entre otros muchos valores la capacidad de ahorro mensual en los hogares, la valoración sobre la perspectiva para mejorar o encontrar empleo, o la intención de compra de una vivienda en el próximo año por los ciudadanos.</p><p>El __uuid__, indicador único para acceder a los datos del CIS vía API en Datary, es el:</p><p><strong><strong> uuid: 5f97ab07-5776-4bf4-816b-d466b6340370</strong></strong></p><p>Actualización de los datos del CIS: <strong><strong>A Diario</strong></strong>.</p><h3 id="google-consumer-barometer-gcb-"><a href="https://datary.io/google" rel="noopener">Google Consumer Barometer (GCB)</a></h3><p>Herramienta desarrollada por el gigante de Mountain View que se encarga de recoger y mostrar como usa la gente internet alrededor del mundo.</p><p>El barómetro recoge los hábitos de comportamiento en función de los dispositivos, a la hora de la compra de multitud de productos (ropa, utensilios para el día a día, vuelos, hoteles, cosméticos, etc…) y teniendo en cuenta las escalas de edad o el grupo demográfico del usuario.</p><!--kg-card-begin: markdown--><p align="center">
 <img alt="Bases de Datos Públicas" src="https://blog.datary.io/content/images/2019/07/gcb-logo2.png" style="width: 500px; height:100px">
</p><!--kg-card-end: markdown--><p>Para un mejor entendimiento de como se estructura el barómetro, Google facilita una <a href="https://storage.googleapis.com/think-v2-emea/v2/30e1b_consumer-barometer.pdf" rel="noopener">guía de uso</a>, que explica como está desarrollado, casos de uso de cómo poder aplicar los datos disponibles así como la metodología para la realización del mismo.</p><p>El __uuid__, indicador único para acceder a los datos del Google Consumer Barometer vía API en Datary, es el:</p><p><strong><strong> uuid: 5f97ab07-5776-4bf4-816b-d466b6340370</strong></strong></p><p>Actualización de los datos del Google Consumer Barometer: <strong><strong>Mensual</strong></strong>.</p><h3 id="organizaci-n-para-la-cooperaci-n-y-el-desarrollo-econ-micos-ocde-"><a href="https://datary.io/oecd" rel="noopener">Organización para la Cooperación y el Desarrollo Económicos (OCDE)</a></h3><p>La OCDE es una institución de cooperación internacional formada por 35 estados que se creó con el objetivo de, a través del intercambio de información y armonizar políticas, maximizar el crecimiento económico y el desarrollo de los países miembros (y también de los no miembros).</p><!--kg-card-begin: markdown--><p align="center">
 <img alt="Bases de Datos Públicas" src="https://blog.datary.io/content/images/2019/07/oecd-building-image.jpg" style="width: 400px; height:300px">
</p><!--kg-card-end: markdown--><p>Desde el punto de vista de los datos, la OCDE ofrece sus decenas de valores socio-económicos relacionados con sus miembros diferenciando entre <a href="https://datary.io/oecd/indicators" rel="noopener">Indicadores</a> y <a href="https://datary.io/oecd/statistics" rel="noopener">Estadísticas</a>.</p><p>El __uuid__, indicador único para acceder a los datos de la OECD vía API en Datary, es el:</p><p><strong><strong> uuid: 0af354f7-e72d-4cd2-b8f2-2bba97c31345</strong></strong></p><p>Actualización de los datos de la OECD: <strong><strong>Mensual</strong></strong>.</p><h3 id="european-union-intellectual-property-office-euipo-"><a href="https://datary.io/euipo" rel="noopener">European Union Intellectual Property Office (EUIPO)</a></h3><p>La Oficina Europea de la Propiedad Industrial publica diariamente datos de registros de marcas y diseños industriales a nivel europeo.</p><p>En especial, gestiona los derechos de las marcas, modelos y dibujos de la UE, el Observatorio Europeo de las Vulneraciones de los Derechos de Propiedad Intelectual y la Base de Datos de Obras Huérfanas.</p><!--kg-card-begin: markdown--><p align="center">
 <img alt="Bases de Datos Públicas" src="https://blog.datary.io/content/images/2019/07/euipo-building-image1.jpg" style="width: 400px; height:300px">
</p><!--kg-card-end: markdown--><p>Con sede en la ciudad española de Alicante, registra cada año una media de 135.000 marcas y cerca de 1.00.000 diseños.</p><p>El __uuid__, indicador único para acceder a los datos de la EUIPO vía API en Datary, es el:</p><p><strong><strong>  uuid: 72aa8aec-72bf-4633-b51d-757555052f09</strong></strong></p><p>Actualización de los datos de la EUIPO: <strong><strong>A Diario</strong></strong>.</p><p><a href="https://datary.io/cipo" rel="noopener">Canadian Intellectual Property Office (CIPO)</a>Agencia estatal responsable de los derechos de copia, marcas registradas y patentes en Canada. Almacena los datos de registro de más de 140 años, lo que supone una cifra de más 1.2 millones de marcas.</p><!--kg-card-begin: markdown--><p align="center">
 <img alt="Bases de Datos Públicas" src="https://blog.datary.io/content/images/2019/07/cipo-image.jpeg" style="width: 500px; height:200px">
</p><!--kg-card-end: markdown--><p>Publican estadísticas anuales y mensuales de los registros, y están adscritos como miembros del WIPO (World Intellectual Property Organization), institución que se encarga de gestionar marcas registradas en varios países a través de un único registro.</p><p>El __uuid__, indicador único para acceder a los datos del CIPO vía API en Datary, es el:</p><p><strong><strong>   uuid: 916746f0-83a2-4cc7-a38a-942060df2449</strong></strong></p><p>Actualización de los datos del CIPO: <strong><strong>A Diario</strong></strong>.</p><h3 id="united-states-patent-and-trademark-office-uspto-"><a href="https://datary.io/uspto" rel="noopener"><strong><strong>United States Patent and Trademark Office (USPTO)</strong></strong></a></h3><p>Agencia del Departamento de Comercio de Estados Unidos encargada del registro de patentes y marcas para la identificación de productos y propiedades intelectuales.</p><!--kg-card-begin: markdown--><p align="center">
 <img alt="Bases de Datos Públicas" src="https://blog.datary.io/content/images/2019/07/uspto-building-image2.jpg" style="width: 400px; height:300px">
</p><!--kg-card-end: markdown--><p>Desde 2008, la oficina ha registrado 8.000.000 de patentes; y concede al año más de 150.000 patentes a empresas y particulares.</p><p>El __uuid__, indicador único para acceder a los datos de la USPTO vía API en Datary, es el:</p><p><strong><strong>   uuid: 256c50d9-4539-4adb-bcdf-a70594fae6d9 </strong></strong></p><p>Actualización de los datos de la USPTO: <strong><strong>A Diario</strong></strong>.</p><h3 id="oficina-espa-ola-de-patentes-y-marcas-oepm-"><a href="https://datary.io/oepm" rel="noopener">Oficina Española de Patentes y Marcas (OEPM)</a></h3><p>Intitución autónoma que se encarga de la recepción, estudio y concesión de las diferentes modalidades de Propiedad Industrial que se conceden en España.</p><p>Dependiente del Ministerio de Industria, Energía y Turismo, concede patentes, modelos de utilidad, marcas, nombres comerciales, certificados complementarios de protección de medicamentos y productos fitosanitarios, topografías de productos semiconductores y diseños industriales.</p><!--kg-card-begin: markdown--><p align="center">
 <img alt="Bases de Datos Públicas" src="https://blog.datary.io/content/images/2019/07/oepm-building-image.jpg" style="width: 400px; height:400px">
</p><!--kg-card-end: markdown--><p>La OEPM, con sede en Madrid, divide su registro entre <a href="https://datary.io/oepm/marcas" rel="noopener">Marcas</a>, <a href="https://datary.io/oepm/patentes" rel="noopener">Patentes</a>, y <a href="https://datary.io/oepm/disenos-industriales" rel="noopener">Diseños Industriales</a>.</p>]]></content:encoded></item><item><title><![CDATA[¿Qué es Datary?]]></title><description><![CDATA[<p>No, <strong><strong>los datos</strong></strong>, el <em>data</em> del que tanto oímos hablar, <strong><strong>no cambiarán el mundo</strong></strong>. No lo harán a menos que seamos capaces de:</p><p>— Almacenar, clasificar y organizar los billones de datos generados cada día;</p><p>— Estandarizar los formatos, haciéndolos accesibles a todos;</p><p>— Disminuir los costes para la compra-venta de los mismos,</p>]]></description><link>https://blog.datary.io/que-es-datary/</link><guid isPermaLink="false">5c00273a1743190001652db0</guid><dc:creator><![CDATA[Fernando Diaz]]></dc:creator><pubDate>Tue, 05 Dec 2017 17:51:00 GMT</pubDate><media:content url="https://blog.datary.io/content/images/2019/08/Cabecera-que-es-datary.png" medium="image"/><content:encoded><![CDATA[<img src="https://blog.datary.io/content/images/2019/08/Cabecera-que-es-datary.png" alt="¿Qué es Datary?"><p>No, <strong><strong>los datos</strong></strong>, el <em>data</em> del que tanto oímos hablar, <strong><strong>no cambiarán el mundo</strong></strong>. No lo harán a menos que seamos capaces de:</p><p>— Almacenar, clasificar y organizar los billones de datos generados cada día;</p><p>— Estandarizar los formatos, haciéndolos accesibles a todos;</p><p>— Disminuir los costes para la compra-venta de los mismos, permitiendo que esos datos se conviertan en fuente de riqueza para los proveedores, y fuente de conocimiento para terceros. </p><p>Teniendo en cuenta estas premisas como punto de partida, nace <a href="https://datary.io/" rel="noopener">Datary</a>, <strong><strong>plataforma definitiva para el intercambio y compra/venta de datos</strong></strong>.</p><figure class="kg-card kg-image-card"><img src="https://blog.datary.io/content/images/2019/07/datary-logo-2.png" class="kg-image" alt="¿Qué es Datary?"></figure><p>La solución para toda aquella persona o empresa que necesite consumir, consultar, vender o compartir datos de un modo fácil y seguro.</p><h3 id="c-ntrate-en-el-dato"><strong><strong>Céntrate en el dato</strong></strong></h3><p>Datary es un proyecto que nace de la mano de Fernando Diaz y Daniel Jadraque.</p><p>Desde el primer momento, ambos fundadores se encontraron dando vueltas a la mejor manera de <strong><strong>solucionar el acceso a grandes fuentes de información</strong></strong>, y su posterior integración en las plataformas que ya usaban los profesionales.</p><p>Es con esta idea en mente, cuando tras pasar por <a href="https://www.tetuanvalley.com/" rel="noopener">Tetuan Valley</a> y <a href="http://www.seedrocket.com/" rel="noopener">SeedRocket</a> (aceleradores de empresas con sede en Madrid) y trabajando desde <a href="https://www.campus.co/madrid/en" rel="noopener">Google Campus Madrid</a>, lanzan lo que fue la primera beta de Datary.</p><!--kg-card-begin: markdown--><p><img src="https://blog.datary.io/content/images/2019/07/campus-seedrocket-microsoft-ventures-logo-1.png" alt="¿Qué es Datary?"><br>
<em>Algunos de los grandes Partners que nos han acompañado en nuestros inicios. / DATARY</em></p>
<!--kg-card-end: markdown--><p>Con el lanzamiento de la beta, tras conseguir los primeros clientes y ser seleccionados por <a href="https://www.microsoftaccelerator.com/" rel="noopener">Microsoft Ventures</a> en Berlín, la solución definitiva se va perfilando, convirtiéndose en un marketplace que de <strong><strong>acceso a los datos más relevantes de un modo rápido, seguro y estandarizado</strong></strong>.</p><p>La plataforma que permita a consultores, PYMEs, científicos de datos, periodistas o estudiantes entre otros, disponer de centenares de <strong><strong>bases de datos</strong></strong>, <strong><strong>privadas y públicas</strong></strong>, de manera organizada para que dediquen su tiempo a trabajar sobre el dato, no a buscarlo.</p><!--kg-card-begin: markdown--><p><img src="https://blog.datary.io/content/images/2019/07/datary-buttons-image-1.png" alt="¿Qué es Datary?"><br>
<em>Consultores, PYMEs, data scientist, periodistas y estudiantes, público objetivo de Datary. / DATARY</em></p>
<!--kg-card-end: markdown--><h3 id="acceso-v-a-api-a-las-bases-de-datos-p-blicas"><strong><strong>Acceso vía API a las bases de datos públicas</strong></strong></h3><p>En Datary tenemos muy claro que si queremos convertirnos en referente debemos ofrecer dos valores clave:</p><ul><li>Ofrecer un inventario de datos realmente valiosos.</li><li>En un formato que facilite su reutilización.</li></ul><p>Es por ello, que el primer paso ha sido ofrecer acceso a los datos de las principales bases de datos públicas (<a href="https://datary.io/ine" rel="noopener">INE</a>, <a href="https://datary.io/cis" rel="noopener">CIS</a>,<a href="https://datary.io/eurostat" rel="noopener">Eurostat</a>, <a href="https://datary.io/cnmc" rel="noopener">CNMC</a>, etc…) de un modo práctico y seguro: <strong><strong>vía JSON a través del API REST</strong></strong> de Datary.</p><p>Asimismo, los usuarios pueden acceder vía web, en <a href="https://datary.io/" rel="noopener">Datary.io</a>, a una intuitiva navegación por los repositorios de las bases de datos disponibles.</p><!--kg-card-begin: markdown--><p><img src="https://blog.datary.io/content/images/2019/07/datary-odm-onboarding-image.png" alt="¿Qué es Datary?"><br>
<em>Vista de la plataforma de Datary, con alguna de las bases de datos disponibles. / DATARY</em></p>
<!--kg-card-end: markdown--><h3 id="actualizaci-n-autom-tica"><strong><strong>Actualización autom</strong>á<strong>tica</strong></strong></h3><p>Por último, destacar de esta primera versión de la plataforma, la continua actualización de los datos disponibles. La tecnología de Datary nos permite ofrecer los <strong><strong>datos actualizados de todas las bases de datos</strong></strong> ofrecidas en la plataforma, asegurando al cliente la última versión disponible de las mismas.</p><p>Sin más, decirte que estamos a tu disposición a través del email <a href="mailto:hello@datary.io">hello@datary.io</a> para solventar cualquier duda o consulta y que será a través de este blog, donde iremos comunicando todas las actualizaciones del producto.</p><hr><p>Para este artículo se han utilizado los iconos “User” by Willson Joseph, “Presentation” by Jeff, “Data Analysis” by Aneeque Ahmed, “Reporter” by Made y “College Student” by Gan Khoon, de <a href="https://thenounproject.com/" rel="noopener">The Noun Project</a>.</p>]]></content:encoded></item></channel></rss>