Kolmannen aallon datan visualisointi

Työkalujen, yleisön ja moodien lähentymisen ymmärtäminen

Tämä on kirjoitus päätapahtumastani 2018 kuvakudoskonferenssista (yllä). Täällä voit nähdä dioja (joista olen saanut useita alla olevista kuvista) kaiuttimien muistiinpanoilla.

Kuvittele, miltä tuntui tehdä tietojen visualisointi 30 vuotta sitten. Se on vuosi 1988 ja käytät Excel 2.0: ta yksinkertaisiin kaavioihin, kuten ympyräkaavioihin ja rivikarttoihin, tai ehkä jotain esimerkiksi SPSS: ää monimutkaisempaan tutkimukseen ja Arc / Info-sijaintia geospatiaalisen datan visualisointiin. Joitakin kaavotyyppejä, joista on tullut melko yleistä, kuten puukarttaa, ei ole edes keksitty vielä. Mutta vuonna 1988 Edward Tuften kvantitatiivisen tiedon visuaalinen näyttö oli jo viisi vuotta vanha.

Kuvaus analyytikoista, jotka käyttävät Excel 2.0: ta ympyräkaavioiden laatimiseen c. 1988

Kuvittele nyt, miltä tuntui tehdä tietojen visualisointi 15 vuotta sitten. Ei ollut D3, ei Tableau, ei ggplot tai edes Prefuse / Flare. Jos haluat tehdä verkon visualisoinnin, voit käyttää äskettäin julkaistua Cytoscapea, vaikka se keskittyi bioinformatiikkaan. Maantieteelliset vaihtoehdot olivat edistyneempiä, kun ArcGIS tarjosi yhä enemmän kartografisia toimintoja monissa punaisissa työkalupaketeissaan.

Ero geospatiaalisen tiedon visualisoinnin ja verkkotietojen visualisoinnin perinneissä: vuonna 2003 se oli jo ArcGIS-version 8.0, kun samana vuonna julkaistiin ensimmäinen moderni verkkotietojen visualisointityökalu: Cytoscape.

Tiedän kuinka paljon tietojen visualisointi on muuttunut, koska vietin viimeisen kymmenen vuoden ajan tietojen visualisointituotteita muodossaan tai toisessa. Suuri julkinen työ, kuten ORBIS ja Kindred Britain, sekä vähemmän julkinen tiedon visualisointi hauskanpitoa tai tutkimusta, analysointia ja etsintää varten. Tietojen visualisoinnin käytännön työskentelyn lisäksi kirjoitin kirjan nykypäivän tehokkaimmasta datan visualisointikirjastosta: D3. Ja sitten kirjoitin sen kirjan uudelleen. Olen viimeisen vuoden aikana kehittänyt omaa semioottista kartoituskirjastoa. Olen myös järjestänyt vuosittaisen tutkimuksen datan visualisoinnin ammattilaisista kahden viime vuoden ajan. Ja matkan varrella olen kirjoittanut tietojen visualisoinnista täällä Mediumilla.

Siksi ei kutsuttu siihen, että minua kutsuttiin pitämään avaintoiminto Tapestry-ohjelmassa. Minua kutsuttiin, koska teen syttyviä kommentteja sosiaalisessa mediassa, haastatteluissa ja ajoittain keskusteluissa. Olen jo kauan sanonut, että datan visualisoinnin kritiikin pitäisi olla mukavampaa, mutta ilman asiayhteyttä esittämäni huomautukset saattavat tuntua mielivaltaisilta ja mielekkäiltä.

Joten olin iloinen saadessani tilaisuuden antaa asiayhteys ja ilmaista huoleni työkalujen ja toimintatapojen lähentymisestä, mutta ajatuksen ja käytännön vastaavaa uudelleenorganisointia ei ole tapahtunut. Näyttää siltä, ​​että puhumme edelleen ja arvioimme datan visualisointia ikään kuin vuosi 1988 tai 2003, jolloin tietojen visualisointia tekevien ihmisten lukumäärä, työkalujen ominaisuudet ja yleisön odotukset ovat lisääntyneet dramaattisesti.

Jatkamme tietojen visualisointiyhteisön jakamista vanhoihin luokkiin, kuten analyytikot, jotka käyttävät BI-työkaluja raporttien luomiseen, kehittäjät, jotka käyttävät koodia mukautettujen tietojen visualisointiin, toimittajat, jotka luovat tietovetoisia tarinoita, tai tutkijat, jotka hyödyntävät tutkittavaa data-analyysiä. Näiden ryhmien sisällä tai välillä meillä on datataiteilijoita, ammattitieteilijöitä, liike-elämän analyytikoita ja työkalun valmistajia, sellaisia ​​kuin voimme nähdä kuolemattomina Susie Lu -sarjakuvissa. Nämä harjoittelukategoriat kuvaavat suoraan tiettyjä työkaluja ja muotoja, jotka ovat myöhässä alkanut muuttua.

1. aalto: Selkeys

Ja niin haluaisin tarjota, että oli nykyaikaisessa tiedon visualisoinnin mielessä Edward Tuftelle keskittynyt ensimmäinen aalto, joka korosti tietopisteiden selkeyttä, yksinkertaisuutta ja suoraa 1: 1-kartoitusta välttäen mahdollisimman paljon muutosta . Tästä aikakaudesta näemme spartan värimaailman nousun - joka keskittyy usein neutraaleihin tai tyydyttymättömiin väreihin yhdellä erottuvalla värillä - merkintöjen ja luonnollisen kielen otsikoiden merkitys ja eräänlainen idealisointi täydellisestä kaaviosta, joka on välittömästi luettavissa, saatavissa ja toimiva. . Eräänlainen kaavio lauseena, jolla on selkeät rakenteet ja säännöt, kuten saatat nähdä artikkelissa Tyyli-elementit.

Aalto 1: Selkeys

2. aalto: järjestelmät

Toinen aalto keskittyi tietojen visualisoinnin tuottamiseen tarvittavien työkalujen kehittämiseen tarvittavan tiedon koodauksen systemaattimiseen. Se keskittyy vaikuttavimpaan aiheeseen liittyvään työhön: Leland Wilkinsonin grafiikan kielioppi. Kaavion sijaan kielellisenä analogisena se on kaavio suulakepuristuksena voimassa olevasta spesifikaatiosta. Grafiikan kieliopin tavoitteena oli antaa ihmisille mahdollisuus luoda grafiikkakokonaisuus. Jos tarkastelemme mitä tahansa tietovisuaalikirjastoa, omaani mukaan lukien, ja näemme sen filosofian toiminnassa.

Nämä työkalut ja kirjastot mainostavat valtavia määriä esimerkkejä, ja värien ja tekstin huolellinen käyttö on korvattu, korvattu rakkauskirjeellä geometriaan. Koko “esimerkiksi” -lähestymistapa on niin juurtunut näihin työkaluihin, että Mike Bostock kirjoitti siihen kokonaisen teoksen.

Aalto 2: Järjestelmät

D3, kuten kaikki tämän ajanjakson työkalut, on suoraan grafiikan kieliopin inspiroima tai voimakkaasti vaikuttanut siihen. Semioottinen, voitto, korkeita taulukoita, Plotly: Kaikki nämä ovat peräisin tai ovat itse D3: n vaikuttavia. Graafisen kieliopin kaksi g: tä ovat ggplot: n nimi. Kirjailija Leland Wilkinson oli päätutkija Tableaussa. Grafiikan kielioppi keskittyy terävällä tavalla tietojen koodaamiseen kanavien kautta geometriaan. Tämä on järjestelmä grafiikan koodaamiseksi datasta, jossa dataominaisuudet vastaavat ja vaikuttavat dynaamisesti pituuteen, kulmaan, väriin tai sijaintiin (tai muuhun graafiseen merkkiin) datan ja datan muutosten perusteella.

Aalto 2: n tarkoituksena oli ottaa nämä teoreettiset järjestelmät ja tuottaa tarvittavat työkalut jokaiselle datan visualisoinnin ammattilaiselle minkä tahansa graafisen lausekkeen luomiseksi datan perusteella. Tämä on hienoa insinööreille ja ohjelmistoarkkitehteille, jotka yrittävät rakentaa kirjastoja tietojen visualisoinnin mahdollistamiseksi, mutta ei välttämättä ammattilaisille, jotka luovat tiedon visualisoinnin tuotteita. Siksi olemme nähneet niin suuren määrän työkaluja ja kirjastoja datan visualisoimiseksi, mutta samanaikainen nousu kaavioissa poseeraavissa surkeissa grafiikoissa.

Täydellisen eritelmän etsiminen dataominaisuuksien koodaamiseksi graafisten kanavien kautta on keino päähän. Mutta tänä aikana rakennettujen järjestelmien voima ja menestys tulivat itselleen loppumiksi, mikä johtaa grafiikan kieliopin peruskäskyyn:

Tämä järjestelmä pystyy tuottamaan kauheaa grafiikkaa. … Tämä järjestelmä ei kuitenkaan voi tuottaa turhaa graafista kuvaa.

Tällä Wilkinson tarkoittaa, että grafiikan ja datan välillä on looginen suhde, mutta se, että grafiikoilla on jonkinlainen "resepti", ei tarkoita, että se olisi jotenkin "ei merkityksetöntä". Datan visualisointi on eräs viestinnän muoto ja jos tuotat kauheita kaavioita, se tarkoittaa, että ne eivät ole luettavissa ja että ne ovat merkityksettömiä.

Datan visualisointi on eräs viestinnän muoto ja jos tuotat kauheita kaavioita, se tarkoittaa, että ne eivät ole luettavissa ja että ne ovat merkityksettömiä.

2. aalto-datan visualisointi, koska siinä ei korostettu järjestelmien suunnittelua, tuotti kamala kojetaulujen ja raporttien metsän. Jokaisessa yrityksen jokaisessa tekniikan osastossa on ainakin yksi ruma reaaliaikakaavio, johon on kirjoitettu jokin D3: lle rakennettu kehys. Jokaisella johdolla on kymmenkunta taulu-kojetaulua, jotka on täytetty välilehdillä ja näkymillä samoista 10-värisistä tyydyttymättömistä virtakaavioista. Näemme kuvakaappauksia näennäisesti tutkivasta data-analyysistä, joka on pudonnut asiakirjoihin tai integroitu kojetauluihin ilman optimoinnin tunnetta. Kaikki tämä tapahtuu huolimatta tekniikoiden kasvavasta piirteiden pariteetista.

3. aalto: Lähentyminen

Tarvitsemme kipeästi uusien tapojen uudelleenarviointia ja uudelleennimeämistä. 5 tai 10 vuotta sitten, millainen tietojen visualisointi teit - oliko kyseessä kojelauta, muistikirja, raportti tai räätälöity viestintäkappale -, oli hyvin erilainen käytetyn kielen, kirjaston tai työkalun mukaan. Näin ei enää ole.

Meidän on kuviteltava uusia lähestymistapoja, joissa tunnustetaan, että lähentyminen ei tapahdu vain työkalujen ominaisuuksissa, vaan myös odottaa käyttäjiä, jotka eivät enää halua hyväksyä, että heidän on poistuttava yhdestä tilasta optimoidaksesi toisen. Tämä merkitsee sitä, että painopisteemme siirtyy yksittäisistä kaavioista tuotteiden rakentamiseen, arviointiin ja toimittamiseen siellä, missä nämä kaaviot näkyvät.

Nteract-muistikirjaalusta mainostaa itseään paitsi perinteisten kannettavien käyttäjien (tutkijoiden ja tietotekijöiden) lisäksi myös laajalle yleisölle, joka on kiinnostunut muutakin kuin

Kannettavat muuttuvat kojetaulun kaltaisiksi, kojetaulut muuttuvat tarinankertomiseksi ja yleisesti ottaen medioiden / moodien ristipölyttäminen ja lähentyminen lisääntyvät. Voit tehdä kauniita grafiikoita R: llä, sinulla voi olla hierarkkisia kaavioita Tableaussa, voit helposti ottaa käyttöön sähköpostiraportteja mukautetulta hallintapaneelilta.

Netflixissä kokeilemme analyyttisiä muistikirjoja, jotka ei ole suunniteltu tutkittavaan tietojen analysointiin, vaan selittävää datan visualisointia sekä siinä tilassa vaadittuja yhteistyö- ja viestintätarpeita. Datalehdistölle yhteiset tarinankerrontatekniikat ovat mielessä niille sidosryhmille, jotka ovat maistuen kehittyneempiä ja odottavat kaadettua animaatiota ja henkilökohtaisia ​​viitekehyksiä.

Näitä suuntauksia on yhä enemmän, jotka meidän on ymmärrettävä paremmin:

  • Kun esoteeriset kaavityypit, kuten puukartat ja solmu-linkkikaaviot, ovat nyt niin helposti saatavissa, että ne ilmestyvät kaikkialle, ja nyt vie todella omituinen kaavio, joka julistetaan ksenografiseksi.
  • Kannettavia tietokoneita käytetään kojetauluina ja myös esineinä tietojen suunnittelussa ja muuntamisessa.
  • Tietojen visualisointi R: ssä on kasvanut lähes yhtä vankkana ja vuorovaikutteisena kuin tietojen visualisointi BI-työkaluissa tai mukautetuissa sovelluksissa.
  • Ihmiset ovat tyytyväisempiä tyylitellyn tiedon visualisoinnin kanssa (luonnosteltava, mutta myös ISOTYPE).

Mihin olemme menossa?

Nämä kaikki tekijät edistävät sitä, mikä mielestäni määrittelee tiedon visualisoinnin kolmannen aallon, jossa muistikirjat, kojetaulut ja pitkämuotoiset tarinankerrokset lähentyvät toisiaan, samoin kuin välineet niiden luomiseksi ja niiden lukijakunnan lukutaito, joihin heidät suunnitellaan. Tätä on tapahtunut jo jonkin aikaa, ja olemme reagoineet siihen, mutta mielestäni on aika pohtia aktiivisesti, mitä tämä tarkoittaa.

Clickbait-taulukot

Tämä vaatii meitä siirtymään pois odotuksesta, että teemme yksittäisiä kaavioita, jotka on optimoitu välittömään luettavuuteen. Arvioimme ja juhlimme datan visualisointia, joka on suunniteltu ja optimoitu yhdelle vierailulle. Se on hieno, mutta meidän on myös edistettävä ja arvioitava ja ymmärrettävä paremmin tietojen käynti, joka on suunniteltu ja optimoitu useaan käyntiin. Käyttöliittymän ja käyttöliittymän on oltava ensiluokkaista huolenaiheita, ja interaktiivisuus ei voi olla vain geometrian ominaisuus. Tätä varten meidän on siirryttävä pois eristetyn geenin mallista, joka luo räätälöityä datan visualisointia ja tuodaan esiin parhaat käytännöt yhteistyöprojekteista, jotka ovat yhteisiä suurelle ohjelmistokehitysyhteisölle.

Edistä kritiikkiä

Jotkin 3D-ympyräkaaviot tai viimeisin ”hämmästyttävä kartta” on helppo halventaa. Se saattaa vaikuttaa siltä, ​​kuinka viimeinen kohta asetettiin, mutta se ei ole, se on yritys, joka ajaa meitä kykenemään vain juhlia sitä, mikä datan visualisoinnissa on hienoa, mutta myös puhumaan rehellisesti, mikä on huonoa. Meidän on tehtävä enemmän siitä, jos haluamme edetä yhteisönä. Mutta kritiikki on vaikeaa - vaikea kuulla ja vaikea antaa hyvin.

Osa syystä, jonka vuoksi kritiikkiä annetaan, otetaan ja edistetään niin huonosti, on, että datan visualisointi on pitkään ollut individualistinen harjoittelu. Toinen syy siihen, että emme ole niin suuria kritiikkiä kohtaan, on se, että meidän yhteisö on juhlayhteisö. Juhla ei kuitenkaan ole täysin myönteinen teko, kun se erottaa ja eksootisoi tehokkaita mekanismeja viestinnän edistämiseksi siten, että ne ovat vain toimittajien tai freelancereiden käytettävissä.

Osittain mielestäni tämän liittyy siihen, että korostamme yksittäisiä kanavia tieteellisessä kirjallisuudessa. Suhtaudumme kriittisesti ympyräkaavioihin, koska tiedämme, että kulmat ovat huonoja koodausarvoon. Mutta meiltä puuttuu ohjeita siitä, kuinka arvioida kokonaisvaltaisemmin, jotta emme pysty selittämään, miksi jotkut koodausvalinnat, vaikka ne eivät olekaan optimaalisia erikseen, voivat osoittautua arvokkaiksi käytännössä. Emme myöskään osaa arvioida vetovoimaa, joten meillä ei ole kieltä tai rakennetta selittääksesi miksi ihmiset pitävät kokoisista piireistä mehilämpöisissä tontteissa ja asteikolla varustetuissa symbolikuvissa yhtä helposti kuin pystymme selittämään, miksi ympyrät ovat huono valinta koodauksen arvoon.

Giorgia Lupin kaavion uudelleensuunnittelu, kirjoittanut Alberto Cairo The Functional Artista.

Toinen syy siihen, miksi emme ole kriittisiä kritiikkiä, on, että meillä on tämä erittäin näkyvä kriittinen malli (jota puolustavat Alberto Kairo sekä Fernanda Viegas ja Martin Wattenberg), mikä antaa parhaan tavan kritiikkiin nimittäin sen uusimiseksi. Vaikka tämä on arvokas lähestymistapa, se on niin kallis työvoima- ja henkisissä sijoituksissa, että tekee siitä luonnollisesti harvemman kuin yksinkertaisesti huomauttaa asiat, jotka eivät toimi datan visualisointituotteessa. Tämän lähestymistavan ohella meidän on edistettävä ja kasvatettava mukavuustasoa vähemmällä kriittisellä muodolla.

Emme voi vain tehdä tätä kirjoittamalla joukko ajatuksia kritiikistä, vaikkakin olisi kiva saada muutama kritiikin taksonomia, kuten meillä on kaavioiden taksonomiat. Meidän on aktiivisesti työskenneltävä kehittämään yhteisöämme olemaan paikka antaa, vastaanottaa ja mallintaa kriittistä keskustelua. Ben Jonesin äskettäinen kappale terveellisen datan visualisointiyhteisön rakentamisesta tarjoaa hyviä ohjeita, jotka perustuvat todellisen maailman kokemuksiin, joita meidän kaikkien tulisi seurata.

Ymmärrä suunnittelu

Jotkut suunnitteluun liittyvät tulokset vuoden 2018 tietojen visualisointitutkimuksesta.

Kyselyvastaukset ja keskustelu osoittavat, että suunnittelu on tärkeä teema datan visualisointikäytännön parantamisessa. Mutta ammattilaiset ovat ilmaisseet sekaannuksen suunnittelun merkityksestä. Tarkoitammeko graafista suunnittelua? UI-suunnittelu? Yleiset suunnittelumalli käsitteet? Tietosuunnittelu? Tietojen visualisoinnissa ei ole lihaisia ​​suunnittelutapoja, joita varhaisen uran ammattilaiset voivat opettaa ja oppia.

Ihastuttavat värit ja gifit, kuten löytyvät Nadieh Bremerin Dragonball Z -datan visualisoinnista tai yksinkertaiset hakkerit, kuten linjan katkeaminen

Hyödynnä huomioekonomiaa

Luulen, että 'silmätietoisuuden' päivä lähestyy nopeasti.
- Otto Neurath

Kun tulin ensin Netflixiin Stanfordista, ajattelin naiivasti, että koska kyse oli yrityksestä, työntekijät pakotettiin käyttämään ja oppimaan tekemäni tiedon visualisointiin. Sain selville nopeasti, että niin ei ollut. Netflixin oma kulttuuri vastusti tällaisia ​​diktatuurisia toimenpiteitä, mutta vieläkin enemmän sidosryhmäni yrittivät tehdä kriittisiä päätöksiä ja datan visualisointituotteeni kilpailivat kymmenen tai useamman muun hallintapaneelin ja raportin kanssa.

Tämän seurauksena Netflixissä sisäisesti tekemämme työ hyödyntää kuvia, gifiä, leikkisä väriä ja uusia visuaalisia menetelmiä käyttäjien ilahduttamiseksi. Vaikka yleinen kielto chartjunkia vastaan ​​on hyvä sääntö, kuten kaikkia asioita, sitä voidaan soveltaa liian tiukasti. Koristeellisempi lähestymistapa, joka tunnustaa huomion talouden olemassaolon jopa datavetoisessa organisaatiossa, johtaa tehokkaampaan datan visualisointiin.

Uutta verta

Olemme jo käyneet läpi yhden sotkuisen ajanjakson, jolloin yhteisömme tunsi tarvetta etääntyä radikaalisti vanhemmasta johtajuudesta siihen pisteeseen, että Edward Tuften estäminen Twitterissä on tullut eräänlaiseksi kulkemisriitiksi. Meidän ei tarvitse tehdä sitä kuullaksesi ja vahvistaaksesi uusia ääniä. Meidän on tunnistettava ja aktiivisesti edistettävä uusia ääniä datan visualisoinnin johtamisessa.

Kuka johtaa 3. aallon tietojen visualisointia? Kuka hyödyntää uusia tapoja, joita liikennemuotojen, yleisöjen ja työkalujen lähentyminen tarjoaa? Miltä tuo uusi teos näyttää? Onko kyseessä kannettavat, joissa on kojetaulujen ominaisuudet ja tietopohjainen tarinankerronta, kuten Krist Wongsuphasawatin Boba Science? Onko uusi lähestymistapa kartoitusvälineisiin, kuten Charticulator? Tai R: n avulla tietojen visualisointigrafiikkaa uutisille, kuten John Burn-Murdochin teoksessa nähty? Tai Giorgia Lupi -tyylinen dataviz Tableaussa, kuten Neil Richards on tehnyt? Vai onko se RJ Andrewsin INFO, johon luotamme, nähty sumea raja tietojen visualisoinnin, marginaalien, sarjakuvien ja tekstin välillä? Vai onko se Mona Chalabin hämmästyttävä käsin piirtämä lähestymistapa? Vai onko se jotain muuta?

Yksi asia on varma, että meillä on esimerkkejä niistä, jotka ovat optimoineet aiempia parhaita käytäntöjä varten, nyt tarvitsemme niitä, jotka edustavat uutta tietojen visualisoinnin aaltoa.