• Cartes minimalistes, par Arthur Charpentier (Visionscarto)
    http://visionscarto.net/cartes-minimalistes
    http://visionscarto.net/local/adapt-img/2048/10x/local/cache-vignettes/L2048xH554/21268707072_31e7-30d66.jpg?1441830455

    Il y a quelques jours j’ai relayé sur twitter ces images vues sur le site imgur, sans explication ni mention d’auteur. Piqué par une question de Matthew Champion qui me demandait comment j’avais fait ces cartes (ce n’était pas le cas), je me suis pris au jeu de les reproduire avec mon langage de programmation favori, #R.

    On est vraiment ravis de présenter cette contribution de @freakonometrics, avec son code source au format notebook #Rmd :
    https://github.com/visionscarto/cartes-minimalistes/blob/master/minimalistes.Rmd

    #tutoriel #programmation #données #cartographie

    http://seenthis.net/messages/407171 via visionscarto


  • Sur #Spotify, Eminem est le plus populaire
    http://rue89.nouvelobs.com/rue89-culture/2015/08/26/spotify-eminem-est-plus-populaire-260926

    Quelles sont les morceaux intemporels ; ceux qui sont écoutés, encore et encore, malgré les années qui passent ? Sans surprise, il s’agit des tubes qui résonnent invariablement dans une soirée, passée la première bouteille. Matt Daniels, déjà connu pour ses analyses musicales sur le vocabulaire des rappeurs, a scanné les sons les plus joués sur Spotify, le service de streaming. En prenant une période qui va des années 1950 à nos jours, il s’est rendu compte que le rappeur américain Eminem arrivait en haut du classement, avec son tube « Lose yourself ». Sorti en 2002, il...

    #musique #Données


  • #Données privées : #Spotify en veut encore plus, et c’est un peu flippant
    http://rue89.nouvelobs.com/rue89-culture/2015/08/21/donnees-privees-spotify-veut-toujours-plus-ca-fait-flipper-260863

    Le service de streaming de #musique Spotify vient de mettre à jouer sa politique de confidentialité pour ses utilisateurs britanniques et américains. Un journaliste de Forbes a lu ces nouvelles conditions pour la Grande-Bretagne – qui sont les mêmes que pour les Etats-Unis – et les a comparées aux anciennes, et détaille : « [Spotify] veut avoir accès aux informations données par le capteur sensoriel de votre téléphone pour savoir si vous êtes en train de marcher, de courir, ou si vous êtes immobile. Spotify veut connaître vos coordonnées de géolocalisation, mettre la main sur...

    #vie_privée


  • Quand le niveau de batterie de votre téléphone devient un mouchard
    http://www.liberation.fr/direct/element/quand-le-niveau-de-batterie-de-votre-telephone-devient-un-mouchard_14537

    #Données_personnelles. Grâce au HTML5, le format qui gère l’affichage des pages Internet, un développeur peut connaître le niveau de batterie du lecteur d’un site. L’idée, pas forcément mauvaise, est d’adapter l’affichage d’un site en fonction de la charge du mobile. Par exemple, ne pas surcharger une page d’images et vidéos pour ne pas trop solliciter d’énergie.

    Mais derrière des idées géniales peuvent se cacher des armes redoutables. Une équipe de chercheurs franco-belges de l’INRIA et de de l’Université catholique de Louvain s’inquiète en effet de l’utilisation de cette technologie pour lever l’anonymat sur les lecteurs.

    En effet, comme l’explique The Guardian, si un internaute navigue en mode privé, ou grâce à un VPN, qui devrait réduire ses possibilités d’identification, et si, peu de temps après, il visite une page sans se protéger, ces deux visites pourraient être reliées par leur niveau de batterie, et un identifiant créé à ce sujet par le navigateur.

    Les chercheurs recommandent que les prochains développement soient moins précis sur le niveau de batterie, en la résumant à des intervalles plutôt qu’un pourcentage. Et que l’accès aux informations de la batterie soient autorisés explicitement par les utilisateurs.

    http://seenthis.net/messages/397541 via tbn


  • #Pakistan : les enjeux de la numérisation des registres fonciers
    http://rue89.nouvelobs.com/2015/08/07/pakistan-les-enjeux-numerisation-registres-fonciers-260660

    C’est une base de #Données qui pourrait changer la donne pour la #corruption au Pakistan : 15 millions de pages tirées des registres fonciers ont été inventoriées, scannées, indexées et informatisées. Zulfiqar Shah, 45 ans, a été chargé de mettre en place le programme Larmis en 2011. « L’objectif est d’éliminer la falsification des registres », explique-t-il. L’idée étant de passer d’un système localisé – propice aux fraudes – à une base de données centralisée. The Express Tribune indique : « Si vous vivez à Larkana et détenez une terre là-bas, vous devez vous rendre...

    #archives #biométrie


  • “Data-Driven DJ” de #Brian_Foo : #sonification de #données variées
    https://datadrivendj.com

    Data-Driven DJ is a series of music experiments that combine data, algorithms, and borrowed sounds.

    My goal is to explore new experiences around data consumption beyond the written and visual forms by taking advantage of music’s temporal nature and capacity to alter one’s mood. Topics will range from social and cultural to health and environmental.

    Each song will be made out in the open: the creative process will be documented and published online, and all custom software written will be open-source. Stealing, extending, and remixing are inevitable, welcome, and encouraged.

    “Distance From Home - Translating four decades of global refugee movement to song”
    https://datadrivendj.com/tracks/refugees

    https://vimeo.com/132833445

    This song was generated using refugee data from the United Nations from 1975 to 2012. The quantity, length, and pitch of the song’s instruments are controlled by the volume of refugee movement and distance traveled between their countries of origin and asylum.

    “Rhapsody In Grey - Using Brain Wave Data to Convert a Seizure to Song”
    https://datadrivendj.com/tracks/brain

    https://vimeo.com/121042482

    This song generates a musical sequence using EEG brain wave data of an anonymous female pediatric patient with epilepsy. The song examines the periods before, during, and after a seizure. The goal is to give the listener an empathetic and intuitive understanding of the brain’s neural activity during a seizure.

    “Mixed Attraction - A Song Mixed Using Data On Race And Attraction”
    https://datadrivendj.com/tracks/dating

    https://vimeo.com/126254913

    This song was created using data on race and attraction among heterosexual couples on OkCupid, a popular online dating website. At any given time, the song’s percussion and vocals are controlled by the attraction (or lack thereof) between two racial groups. In a perfect world where sexual preference is “color-blind”, the resulting song would be monotonous and repetitive. Since the world is not perfect, the song is very dynamic with contrasting elements, which highlights the disparities of attraction between different racial groups in the context of online dating and beyond. The goal is to give the listener a visceral reaction to the unevenness of the data.

    Via
    http://rue89.nouvelobs.com/rue89-culture/2015/07/20/migrations-pollution-brian-foo-fait-chanter-les-donnees-260209

    #audio

    http://seenthis.net/messages/391457 via intempestive



  • Le #business des écoutes et des #données_personnelles | POLICEtcetera
    http://moreas.blog.lemonde.fr/2015/06/21/le-business-des-ecoutes-et-des-donnees-personnelles

    lors de ce débat un rien métaphysique sur la loi sur le renseignement, il n’a pas été question d’argent. Les parlementaires ont voté yeux bandés et poches cousues. Si je peux me permettre une suggestion, il me semble qu’une petite taxe, genre écotaxe, sur les abonnements téléphoniques ou ADSL pourraient très bien faire l’affaire. On pourrait l’appeler « #sécuritaxe » !

    le #coût de la #surveillance

    http://seenthis.net/messages/383252 via Fil


  • La pauvreté se concentre dans les villes-centres plus que dans les périphéries
    http://www.lemonde.fr/societe/article/2015/06/02/la-pauvrete-se-concentre-dans-les-villes-centres-plus-que-dans-les-peripheri

    C’est dans les #centres-villes des grands pôles urbains que se concentre la #pauvreté en France, bien plus que dans les banlieues et les couronnes périurbaines. L’Insee livre, dans une étude publiée mardi 2 juin, une image détaillée et actualisée de la pauvreté, déjà esquissée dans son « Portrait social de la France » en novembre 2014. Et confirme qu’à rebours des thèses défendues par le géographe Christophe Guilluy en septembre 2014 dans son ouvrage La France périphérique (Flammarion, 18 euros), « la pauvreté est dans l’ensemble la plus forte dans les villes-centres des grandes aires urbaines ».

    Dans ces cœurs d’agglomération, 20 % des ménages en moyenne ont un niveau de vie inférieur au seuil de pauvreté. Le taux de pauvreté dans les villes-centres « atteint parfois deux à trois fois celui des banlieues et plus de quatre fois celui des couronnes périurbaines », souligne l’Insee. Plus on s’éloigne du centre, plus ce taux recule : il est de 14 % dans les proches banlieues, de 10 % environ dans les grandes couronnes.

    Dans les grands pôles urbains, les niveaux de vie médians « sont presque toujours plus élevés en banlieue qu’en ville-centre », souligne l’Insee. « Cela recouvre de grandes disparités : ces pôles urbains regroupent des villes hétérogènes, avec des populations aisées et de la pauvreté », précise Luc Brière, chef de la division statistiques régionales, locales et urbaines de l’Insee.

    « Revenu disponible »

    Pour établir ces statistiques basées sur les indicateurs de 2012 – les plus récents disponibles –, l’Insee a pu, pour la première fois, utiliser un fichier de #données_sociales et fiscales exhaustif, baptisé #Filosofi. Celui-ci croise les données fiscales issues de la direction des finances publiques et les données sur les #prestations_sociales fournies par les principaux organismes prestataires. « Ce fichier nous permet de nous baser sur le #revenu_disponible, et non seulement le revenu fiscal. Pour parler correctement de la pauvreté, il faut tenir compte aussi des prestations sociales reçues et des impôts payés, explique Luc Brière. Grâce à Filosofi, nous pouvons aussi travailler au niveau communal, et non plus seulement à une échelle départementale. »

    Alors que Christophe Guilluy, pour souligner la fracture entre des métropoles mondialisées et des territoires périphériques laissés pour compte, assurait que la question sociale se concentrait « de l’autre côté des métropoles, dans les espaces ruraux, les petites villes, les villes moyennes, dans certains espaces périurbains », l’étude de l’Insee montre au contraire une pauvreté limitée dans les communes situées aux portes des grandes aires urbaines.

    Et si les communes isolées, rurales ou peu denses situées en dehors de l’attraction d’un pôle urbain affichent un taux de pauvreté élevé – 17 % –, elles n’hébergent malgré tout que 5 % de la population pauvre en France. « Globalement, 77 % de la population pauvre réside dans les 230 grandes aires urbaines de métropole, dont 65 % dans les grands pôles urbains et 20 % dans l’aire urbaine de Paris » , résume l’Insee.

    De fortes inégalités

    Les villes-centres sont aussi celles qui concentrent les plus fortes inégalités. « Le niveau de vie au-dessus duquel se situent les 10 % de personnes les plus aisées est en moyenne plus de 4,4 fois supérieur à celui en dessous duquel se trouvent les 10 % les moins aisés », détaille l’Insee. A Paris, ce coefficient est même de 6,7 fois… contre un rapport de 3,5 fois en moyenne sur l’ensemble de la population.

    Dans ces cœurs d’agglomération, la part des revenus du patrimoine représente 30 % du revenu pour les 10 % les plus riches, quand la part des prestations sociales atteint 46 % du revenu des 10 % les plus pauvres.

    Sans surprise, ce sont les ménages jeunes, les familles nombreuses et les familles monoparentales qui sont le plus touchés par la pauvreté. Dans les villes-centres, 27 % des ménages jeunes, 35 % des familles monoparentales et 37 % des ménages de cinq personnes et plus vivent en situation de pauvreté. A l’inverse, là aussi, c’est dans les couronnes des grands pôles urbains que ces taux sont les plus faibles.
    A plus grande échelle, les statistiques issues du fichier Filosofi soulignent une pauvreté très élevée en Corse, Languedoc-Roussillon et Nord - Pas-de-Calais (autour de 20 %), tandis que le taux de pauvreté reste autour de 10 % en Bretagne et Pays de la Loire. L’Ile-de-France compte à la fois les départements ayant le plus fort et le plus faible taux de pauvreté (9 % dans les Yvelines, 27 % en Seine-Saint-Denis).

    Après des décennies d’éviction des prolos et pauvres, Paris est exemplaire de cette forte polarisation sociale des grandes villes, une ville riche faite pour les riches, avec une quantifié phénoménale de pauvres (environ 70 000 #Rsastes et 250 000 #CMU, pour ne prendre que ces deux indices). Bien sûr, la pauvreté n’est pas qu’affaire monétaire ; d’une part la structure des dépenses diffère (moins de bagneule, plus de loyer) et les ressources disponibles aussi. Pas de potager, mais des transports éventuellement gratuits, une "offre culturelle dont une part est gratuite (plus de concert dans plus d’église, plus de musée accessibles aux chômeurs, etc), et souvent plus de facilité à être employé dans ces villes. Bref, le dic de l’’Insee est une saisie partielle. On est pas près de savoir qui sont les « vrais pauvres »...

    http://seenthis.net/messages/376353 via colporteur


  • Pôle emploi doit ouvrir l’accès aux données sur les chômeurs, Stéphanie Delestre, PDG de Qapa.fr ( "274 975 offres à pourvoir maintenant. Des milliers d’entreprises recrutent sur Qapa. Ne manquez pas ces opportunités" )
    http://www.lemonde.fr/idees/article/2015/06/02/pole-emploi-doit-ouvrir-l-acces-aux-donnees-sur-les-chomeurs_4645957_3232.ht

    900 000 emplois non pourvus ou difficilement pourvus [ben voyons], 5 millions de #chômeurs : cherchez l’erreur. Fluidifier le marché de l’emploi passe par l’ouverture des #données détenues par #Pôle_Emploi à tous les acteurs du #marché_du_travail.

    Le système administré et centralisé qu’est Pôle emploi est inapte à réaliser de manière parfaitement efficiente l’adéquation entre les offres et les demandes sur le marché du travail. Aujourd’hui, la qualification des demandes d’emploi par les opérateurs publics se fait par des références à des nomenclatures préexistantes et faiblement évolutives (par exemple la nomenclature ROME [répertoire opérationnel des métiers et des emplois]), peu adaptées à l’accélération des mutations économiques et technologiques ou des changements de parcours professionnels.

    Les offres présentées à un demandeur d’emploi par les institutions spécialisées sont ainsi souvent peu pertinentes. Dans ces conditions, c’est souvent la stratégie individuelle d’un demandeur d’emploi qui lui permet de trouver le bon employeur, intéressé par ses compétences et son parcours et lui proposant un emploi correspondant à sa recherche et à ses souhaits d’évolution professionnelle.

    De 2 heures à 30 minutes par jour

    Or, les stratégies individuelles sur le marché de l’emploi ne font pas encore l’objet d’une observation et d’une interprétation pertinentes pour en faire émerger une intelligence collective propice à l’#efficience_du_marché. Par ailleurs, les demandeurs d’emploi sont confrontés à des difficultés sociales directement liées à leur situation : la passivité et la rupture progressive du lien social rendent d’autant plus difficile leur réinsertion durable sur le marché du travail.

    De nombreux travaux de recherche (Krueger et Mueller, Université de Princeton, 2011) montrent que l’intensité de la recherche d’emploi diminue substantiellement au long d’une période de #chômage. Il est ainsi observé sur un échantillon de demandeurs d’emploi américains qu’après trois mois de chômage la durée quotidienne de recherche d’emploi chute de 2 heures à 30 minutes par jour.

    Avec plus de 5 millions de chômeurs et environ 500 000 offres d’emploi disponibles à un instant « T » sur le marché, c’est la mise en relation efficiente entre l’offre et la demande, entre les candidats et les offres d’emploi, qui doit se développer grâce au numérique (qui offre la possibilité de traiter des grandes quantités de données en temps réel) et à Internet (qui met en relation automatique et en temps réel l’offre et la demande).

    Écosystème de services

    La précision et la quantité des informations sont les clés pour obtenir les meilleurs résultats de matching (appariement). Pôle emploi dispose pour cela d’une énorme quantité « #matière_première » (les CV des chômeurs et les offres d’emploi) sur laquelle un écosystème de services et d’applications innovants peut se nourrir et se développer rapidement pour lutter contre le chômage [ben voyons].

    Ces données sont aussi intéressantes pour les acteurs publics locaux afin de comprendre les besoins de chaque bassin d’emploi, les besoins en formation par secteur d’activité, etc. Les usages sont infinis. Alors pourquoi Pôle emploi refuse-t-il l’accès à ses données, contrairement à ce que recommande le secrétariat général à la modernisation de l’action publique ? Est-ce la peur que de nouveaux acteurs apportent un meilleur service ? Est-ce la peur que le chômage baisse vraiment, et que l’activité même de Pôle Emploi soit à réinventer ?

    Pour accélérer le retour des chômeurs à l’emploi, Pôle emploi doit ouvrir en #open_data ses fichiers d’offres d’emploi et de demandeurs d’emploi [bigre]. En d’autres termes, transformer ses fichiers en données publiques, accessibles à toutes les entreprises dont l’objet est la #fluidité du marché de l’emploi. La lutte contre le chômage doit être la grande cause nationale de la France. Tout demandeur d’emploi doit pouvoir réclamer que sa #candidature soit accessible à tous les recruteurs potentiels !

    La création d’un corps de 200 agents contrôleurs indique bien ce qui donne le la : à Pôle la non indemnisation, les « emplois aidés » et les contrôles, le placement aux #opérateurs_privés, et à qui voudra s’en occuper (...), l’info sur les droits (toujours changeants, soumis à l’arbitraire, conçus pour déstabiliser, produire l’#insécurité_sociale maxi), les recours, la défense des chômeurs.

    http://seenthis.net/messages/376713 via colporteur


  • The Bitglass «Where’s Your Data?» Experiment
    http://www.bitglass.com/company/news/press_releases/bitglasswheresyourdata

    Bitglass (…) undertook an experiment geared towards understanding what happens to sensitive data once it has been stolen. In the experiment, stolen data traveled the globe, landing in five different continents and 22 countries within two weeks. Overall, the data was viewed more than 1,000 times and downloaded 47 times; some activity had connections to crime syndicates in Nigeria and Russia.

    The Bitglass threat research team programmatically synthesized 1,568 fake names, social security numbers, credit card numbers, addresses and phone numbers that were saved in an Excel spreadsheet. The spreadsheet was then transmitted through the Bitglass proxy, which automatically watermarked the file. Each time the file is opened, the persistent watermark, which survives copy, paste and other file manipulations, “calls home” to record view information such as IP address, geographic location and device type. Finally, the spreadsheet was posted anonymously to cyber-crime marketplaces on the Dark Web.

    #data #criminalité #données_personnelles

    http://seenthis.net/messages/365511 via Fil


  • Do Not Track — webdoc (Upian)
    http://seenthis.net/messages/361167

    Do Not Track — #webdoc (Upian) https://donottrack-doc.com

    À qui profitent nos #données_personnelles ? Découvrez le #tracking, une industrie opaque qui génère des milliards avec ce qu’elle sait de nous.

    https://donottrack-doc.com/images/share.jpg

    http://www.theguardian.com/world/2015/apr/14/brett-gaylor-do-not-track-interactive-documentary-privacy

    (pas vraiment du #shameless_autopromo mais j’ai un petit peu mis les doigts dans le code pour fluidifier l’animation #d3.js)❞


  • Ce « Big Brother » dissimulé au cœur du renseignement, par Jacques Follorou (Le Monde, 11/04/2015) http://lemonde.fr/societe/article/2015/04/11/ce-big-brother-dissimule-au-c-ur-du-renseignement_4614233_3224.html

    C’est un sigle impersonnel, « #PNCD », mais il cache un secret sur lequel la République a réussi, depuis 2007, à maintenir un silence absolu. Derrière ces quatre lettres se dissimule la Plateforme nationale de cryptage et de décryptement [@stephane s’arrache les cheveux], un système complexe et occulte de recueil massif et de stockage de #données_personnelles étrangères et françaises dans lequel les services de renseignement français puisent à leur guise et sans aucun contrôle autre que leur propre hiérarchie.

    Le Monde avait révélé, en 2013, l’existence de ce dispositif et s’était vu opposer (...)

    #services_secrets #GCHQ #NSA #CNCIS #surveillance #DGSI #DGSE #câbles_sous-marins #PJLRenseignement #secret-défense #PNCD #données_personnelles