Bevezetés az R programozási nyelvbe 2. Adatkeretek
Ebben a blogposztban a táblázatos formában tárolt adatok alapszintű kezeléséről lesz szó. Ezeket az R nyelvben egy kétdimenziós adatstruktúra, az adatkeret (data frame) reprezentálja.
Ebben a blogposztban a táblázatos formában tárolt adatok alapszintű kezeléséről lesz szó. Ezeket az R nyelvben egy kétdimenziós adatstruktúra, az adatkeret (data frame) reprezentálja.
Ebben a most induló sorozatban igyekszem szisztematikusan feltérképezni az R nyelv fontosabb alkotóelemeit. Első alkalommal az úgynevezett vektorokról lesz szó. Ezt az lépten-nyomon használt adatstruktúrát úgy kell elképzelni, mint a halmazokat. Az adatok egy halmazát.
A hálózatokkal való foglalatoskodás legnagyobb részét az adatok összegyűjtése és azok megfelelő előkészítése teszi ki. Ezek után persze már alig várja az ember, hogy valamit lásson is a munkájából. A hálózatok megjelenítésére és elemzésére szolgáló számos szoftveres megoldásból a digitális bölcsészet- és társadalomtudományok terén a Gephi a legnépszerűbb alkalmazás.
A hálózatok ábrázolásának és elemzésének automatizálása felé vezető út fontos állomása az, amikor az adatainkból a számítógép által hálózatként érzékelt struktúrát hozunk létre. Mai témánk ezt a nem túl látványos, de annál fontosabb részfeladatát mutatja be a hálózatok manipulálásának.
A külső alkalmazásokban – például az Accessben, Excelben vagy a Google Táblázatokban – előállított adatállományokhoz való hozzáférés, ezeknek az R-be való beolvasása és az onnan történő kimentése mindennapos igény, mondhatni rutinfeladat. Ez a blogposzt egy fogódzót szándékozik adni ehhez.