A többváltozós skálázás (MDS) egy olyan eszköz, amellyel megjeleníthető az egyes esetek hasonlósági szintje egy adatkészletben. Az információk megjelenítésére, különösen a távolságmátrixban fogl alt információk megjelenítésére használt kapcsolódó ordinációs módszerek összességére utal. Ez a nemlineáris dimenziócsökkentés egyik formája. Az MDS algoritmus célja, hogy minden objektumot egy N-dimenziós térben helyezzen el úgy, hogy az objektumok közötti távolság a lehető legjobban megmaradjon. Ezután minden objektumhoz hozzárendelnek koordinátákat az N dimenzióban.
Az MDS-gráf dimenzióinak száma meghaladhatja a 2-t, és előzetesen meghatározásra kerül. Az N=2 kiválasztása optimalizálja az objektumok elhelyezését a 2D szórásdiagramhoz. A többdimenziós méretezésre a cikk képei között láthat példákat. Az orosz szimbólumokat tartalmazó példák különösen szemléletesek.
Essence
Többdimenziós skálázás módszere (MMS,MDS) a klasszikus eszközök kiterjesztett készlete, amely általánosítja az optimalizálási eljárást veszteségi függvények halmazára és ismert távolságok bemeneti mátrixaira, súlyokkal és így tovább. Ebben az összefüggésben egy hasznos veszteségfüggvényt stressznek neveznek, amelyet gyakran minimalizálnak a stressz majorizációnak nevezett eljárással.
Kézi
Több lehetőség van a többdimenziós méretezésre. Az MDS programok automatikusan minimalizálják a terhelést, hogy megoldást találjanak. A nem metrikus MDS algoritmus lényege egy kettős optimalizálási folyamat. Először is meg kell találni az optimális monoton közelségi transzformációt. Másodszor, a konfigurációs pontokat optimálisan kell elhelyezni, hogy távolságuk a lehető legjobban illeszkedjen a skálázott közelségi értékekhez.
Bővítés
A metrikus többdimenziós skálázás kiterjesztése a statisztikákban, ahol a céltér egy tetszőleges sima, nem euklideszi tér. Ahol a különbségek a távolságok egy felületen és a céltér egy másik felület. A tematikus programok lehetővé teszik, hogy az egyik felület minimális torzításával a másikhoz csatolást találjon.
Lépések
A többváltozós skálázással végzett vizsgálat több lépésből áll:
- A probléma megfogalmazása. Milyen változókat szeretne összehasonlítani? Hány változót szeretne összehasonlítani? Milyen célra fogják használni a tanulmányt?
- Bemeneti adatok lekérése. A válaszadóknak kérdéseket tesznek fel. Minden termékpárnál értékelniük kell a hasonlóságot (általában egy 7 fokozatú Likert-skálán a nagyon hasonlótól a nagyon eltérőig). Az első kérdés lehet például a Coca-Cola/Pepsi, a következő a sör, a következő a Dr. Pepper stb. A kérdések száma a márkák számától függ.
Alternatív megközelítések
Két másik megközelítés létezik. Létezik egy "Perceptual Data: Derived Approach" nevű technika, amelyben a termékeket attribútumokra bontják, és az értékelést szemantikai differenciálskálán végzik. Egy másik módszer a „preferenciaadatok megközelítése”, amelyben a válaszadókat a preferenciákról kérdezik, nem pedig a hasonlóságokról.
A következő lépésekből áll:
- Az MDS statisztikai program indítása. Az eljárás végrehajtására szolgáló szoftver számos statisztikai szoftvercsomagban elérhető. Gyakran lehet választani a metrikus MDS (amely az intervallum- vagy arányszintű adatokkal foglalkozik) és a nem metrikus MDS (amely az ordinális adatokkal foglalkozik) között.
- Mérések számának meghatározása. A kutatónak meg kell határoznia a számítógépen elkészíteni kívánt mérések számát. Minél több mérés történik, annál jobb a statisztikai illeszkedés, de annál nehezebb az eredményeket értelmezni.
- Eredmények megjelenítése és mérések meghatározása – a statisztikai program (vagy a kapcsolódó modul) megjeleníti az eredményeket. A térkép minden terméket megjelenít (általában 2D-ben).hely). A termékek egymáshoz való közelsége vagy hasonlóságukat vagy preferenciájukat jelzi, attól függően, hogy melyik megközelítést alkalmazták. Nem mindig világos azonban, hogy a mérések valójában hogyan felelnek meg a rendszer viselkedésének méréseinek. Itt lehet szubjektív ítéletet alkotni a megfelelőségről.
- Ellenőrizze az eredmények megbízhatóságát és érvényességét – számítsa ki az R-négyzetet, hogy meghatározza a skálázott adatok szórásának az MDS eljárással számolható arányát. A négyzet R 0,6 a minimálisan elfogadható szint. Az R négyzet 0,8 jó a metrikus skálázáshoz, míg a 0,9 a nem metrikus skálázáshoz.
Különféle tesztek
További lehetséges tesztek a Kruskal-típusú stressztesztek, az osztott adattesztek, az adatstabilitási tesztek és az újratesztelési megbízhatósági tesztek. Írjon részletesen a teszt eredményeiről! A leképezés mellett meg kell adni legalább a távolság mértékét (pl. Sorenson index, Jaccard index) és a megbízhatóságot (pl. feszültségérték).
Nagyon kívánatos olyan algoritmus megadása is (pl. Kruskal, Mather), amelyet gyakran a használt program határoz meg (néha helyettesíti az algoritmus jelentést), ha adott egy kezdő konfigurációt, vagy véletlenszerűen választott, szám dimenziófuttatások, Monte Carlo eredmények, az iterációk száma, a stabilitási pontszám és az egyes tengelyek arányos szórása (r-négyzet).
Vizuális információ- és adatelemzési módszertöbbdimenziós méretezés
Az információs vizualizáció az absztrakt adatok interaktív (vizuális) megjelenítésének tanulmányozása az emberi megismerés javítása érdekében. Az absztrakt adatok numerikus és nem numerikus adatokat is tartalmaznak, például szöveges és földrajzi információkat. Az információs vizualizáció azonban különbözik a tudományos vizualizációtól: „információs (információs vizualizáció), amikor egy térbeli reprezentációt választanak, és scivis (tudományos vizualizáció), amikor egy térbeli reprezentációt adunk meg.”
Az információ-vizualizáció területe az ember-számítógép interakció, a számítástechnikai alkalmazások, a grafika, a látványtervezés, a pszichológia és az üzleti módszerek kutatásából jött létre. Egyre gyakrabban használják a tudományos kutatás, a digitális könyvtárak, az adatbányászat, a pénzügyi adatok, a piackutatás, a gyártásellenőrzés stb. alapvető összetevőjeként.
Módszerek és alapelvek
Az információ-vizualizáció azt sugallja, hogy a vizualizációs és interakciós módszerek kihasználják az emberi észlelés gazdagságát, lehetővé téve a felhasználók számára, hogy egyidejűleg nagy mennyiségű információt lássanak, fedezzenek fel és megértsenek. Az információvizualizáció célja, hogy megközelítéseket hozzon létre absztrakt adatok, információk intuitív módon történő kommunikálására.
Az adatelemzés minden alkalmazott kutatás és problémamegoldás szerves részét képezi az iparban. A legtöbbAz adatelemzés alapvető megközelítései a vizualizáció (hisztogramok, szórásdiagramok, felszíni diagramok, fatérképek, párhuzamos koordináta diagramok stb.), statisztika (hipotézisvizsgálat, regresszió, PCA stb.), adatelemzés (illesztés stb.)..d.) és gépi tanulási módszerek (klaszterezés, osztályozás, döntési fák stb.).
E megközelítések közül az információ-vizualizáció vagy a vizuális adatelemzés a leginkább az elemző személyzet kognitív készségeitől függ, és lehetővé teszi strukturálatlan, használható betekintések felfedezését, amelyeknek csak az emberi képzelet és kreativitás szab határt. Az elemzőnek nem kell bonyolult technikákat megtanulnia ahhoz, hogy értelmezni tudja az adatvizualizációkat. Az információvizualizáció egyben hipotézisgenerálási séma is, amelyet általában analitikusabb vagy formálisabb elemzések, például statisztikai hipotézisvizsgálatok kísérhetnek, és általában kísérnek vele.
Tanulmány
A vizualizáció modern tanulmányozása a számítógépes grafikával kezdődött, amelyet "a kezdetektől fogva tudományos problémák tanulmányozására használtak. A kezdeti években azonban a grafikai teljesítmény hiánya gyakran korlátozta a használhatóságát. A vizualizáció prioritása elkezdődött 1987-ben fejlesztették ki, a tudományos számítástechnikában használt számítógépes grafika és vizualizáció speciális szoftverének kiadásával Azóta több konferenciát és workshopot tartottak az IEEE Computer Society és az ACM SIGGRAPH közös szervezésében."
Az adatvizualizáció, az információvizualizáció és a tudományos vizualizáció általános témáival foglalkoztak,valamint specifikusabb területek, például a kötet renderelése.
Összefoglaló
Generalized Multidimensional Scaling (GMDS) a metrikus többdimenziós skálázás kiterjesztése, amelyben a céltér nem euklideszi. Ha a különbségek egy felületen lévő távolságok, és a céltér egy másik felület, a GMDS lehetővé teszi, hogy minimális torzítással megtalálja az egyik felület egymásba ágyazását.
A
GMDS egy új kutatási irány. Jelenleg a fő alkalmazások a deformálható objektumfelismerés (például a 3D arcfelismeréshez) és a textúra-leképezés.
A többdimenziós méretezés célja többdimenziós adatok megjelenítése. A többdimenziós adatok, vagyis azok az adatok, amelyek ábrázolásához kettőnél vagy háromnál több dimenzióra van szükség, nehezen értelmezhetők. Az egyszerűsítés egyik módja annak feltételezése, hogy a kérdéses adatok egy beágyazott nemlineáris sokaságon vannak egy nagy dimenziós térben. Ha a gyűjtő mérete elég alacsony, az adatok kis dimenziós térben is megjeleníthetők.
A nemlineáris dimenziócsökkentési módszerek közül sok kapcsolódik a lineáris módszerhez. A nemlineáris módszerek nagyjából két csoportba sorolhatók: azok, amelyek leképezést biztosítanak (akár a nagy dimenziós tértől az alacsony dimenziós beágyazásig, akár fordítva), és azok, amelyek egyszerűen csak vizualizációt biztosítanak. A gépi tanulás keretében a leképezési módszereket úgy tekinthetjüka jellemzők kinyerésének egy előzetes szakasza, amely után mintafelismerő algoritmusokat alkalmaznak. Általában azok, amelyek csak vizualizációt adnak, közelségi adatokon – azaz távolságméréseken – alapulnak. A többdimenziós skálázás meglehetősen gyakori a pszichológiában és más bölcsészettudományokban is.
Ha az attribútumok száma nagy, akkor az egyedi lehetséges karakterláncok tere is exponenciálisan nagy. Így minél nagyobb a méret, annál nehezebb a teret ábrázolni. Ez sok problémát okoz. Azok az algoritmusok, amelyek nagy dimenziós adatokon működnek, általában nagyon bonyolultak az időben. Az adatok kevesebb dimenzióra való csökkentése gyakran hatékonyabbá teszi az elemzési algoritmusokat, és segíthet a gépi tanulási algoritmusoknak pontosabb előrejelzések készítésében. Ezért olyan népszerű a többdimenziós adatskálázás.