matheraum.de
Raum für Mathematik
Offene Informations- und Nachhilfegemeinschaft

Für Schüler, Studenten, Lehrer, Mathematik-Interessierte.
Hallo Gast!einloggen | registrieren ]
Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum
Forenbaum
^ Forenbaum
Status Hochschulmathe
  Status Uni-Analysis
    Status Reelle Analysis
    Status UKomplx
    Status Uni-Kompl. Analysis
    Status Differentialgl.
    Status Maß/Integrat-Theorie
    Status Funktionalanalysis
    Status Transformationen
    Status UAnaSon
  Status Uni-Lin. Algebra
    Status Abbildungen
    Status ULinAGS
    Status Matrizen
    Status Determinanten
    Status Eigenwerte
    Status Skalarprodukte
    Status Moduln/Vektorraum
    Status Sonstiges
  Status Algebra+Zahlentheo.
    Status Algebra
    Status Zahlentheorie
  Status Diskrete Mathematik
    Status Diskrete Optimierung
    Status Graphentheorie
    Status Operations Research
    Status Relationen
  Status Fachdidaktik
  Status Finanz+Versicherung
    Status Uni-Finanzmathematik
    Status Uni-Versicherungsmat
  Status Logik+Mengenlehre
    Status Logik
    Status Mengenlehre
  Status Numerik
    Status Lin. Gleich.-systeme
    Status Nichtlineare Gleich.
    Status Interpol.+Approx.
    Status Integr.+Differenz.
    Status Eigenwertprobleme
    Status DGL
  Status Uni-Stochastik
    Status Kombinatorik
    Status math. Statistik
    Status Statistik (Anwend.)
    Status stoch. Analysis
    Status stoch. Prozesse
    Status Wahrscheinlichkeitstheorie
  Status Topologie+Geometrie
  Status Uni-Sonstiges

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Neuerdings beta neu
 Forum...
 vorwissen...
 vorkurse...
 Werkzeuge...
 Nachhilfevermittlung beta...
 Online-Spiele beta
 Suchen
 Verein...
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
StartseiteMatheForenmathematische StatistikClusteranalyse
Foren für weitere Schulfächer findest Du auf www.vorhilfe.de z.B. Philosophie • Religion • Kunst • Musik • Sport • Pädagogik
Forum "mathematische Statistik" - Clusteranalyse
Clusteranalyse < math. Statistik < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "mathematische Statistik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Clusteranalyse: Korrekturlesung
Status: (Frage) beantwortet Status 
Datum: 11:25 Do 09.07.2009
Autor: Marcel08

Aufgabe
[Dateianhang nicht öffentlich]

Hallo Community,


über eine Korrekturlesung meiner nachfolgenden Lösung würde ich mich freuen.



Gemäß der euklidischen Distanz [mm] d_{ij}=\wurzel{\summe_{k=1}^{p}(x_{ik}-x_{jk})^{2}} [/mm] erhalten wir die Einträge der Distanzmatrix D


[mm] d_{12}=\wurzel{(x_{11}-x_{21})^{2}+(x_{12}+x_{22})^{2}}=1.00 [/mm]      
    

[mm] d_{13}=\wurzel{(x_{31}-x_{11})^{2}+(x_{32}+x_{12})^{2}}=4.24 [/mm]

[mm] d_{14}= \vdots [/mm]                   =5.65

[mm] d_{23}= \vdots [/mm]                   =3.61

[mm] d_{24}= \vdots [/mm]                   =5.00

[mm] d_{34}= \vdots [/mm]                   =1.41



Daraus ergibt sich


[mm] D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 } [/mm]



Die City-Block-Distanz [mm] d_{ij}=\summe_{k=1}^{p}|x_{ik}-x_{jk}| [/mm] liefert


[mm] d_{23}=\summe_{k=1}^{2}|x_{2k}-x_{3k}|=|2-5|+|2-4|=5 [/mm]



Wir haben [mm] D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 } [/mm]


Fusionsschritt 1: Die kleinste Distanz (ausgenommen die Einträge der Hauptdiagonalen) ist [mm] d_{12}=1 [/mm]


[mm] \Rightarrow [/mm] (1) und (2) werden verschmolzen.

[mm] \Rightarrow P_{3}=((1,2),(3),(4)) [/mm]

[mm] \Rightarrow D_{(1,2),(3)}=max(4.24,3.61)=4.24 [/mm]

[mm] \Rightarrow D_{(1,2),(4)}=max(5.65,5.00)=5.65 [/mm]



Es ergibt sich die folgende Distanzmatrix


[mm] \pmat{ 0 & 4.24 & 5.65 \\ 4.24 & 0 & 1.41 \\ 5.65 & 1.41 & 0 } [/mm]


Fusionsschritt 2: Die kleinste Distanz der Distanzmatrix (ausgenommen der Einträge der Hauptdiagonalen) ist [mm] d_{34}=1.41 [/mm]


[mm] \Rightarrow [/mm] (3) und (4) werden verschmolzen.

[mm] \Rightarrow P_{2}=((1,2),(3,4)) [/mm]

[mm] \Rightarrow D_{(1,2),(3,4)}=max(4.24,5.65)=5.65 [/mm]



Wir erhalten die letzte Distanzmatrix


[mm] \pmat{ 0 & 5.65 \\ 5.65 & 0 } [/mm]


Fusionsschritt 3: (1,2) und (3,4) werden verschmolzen.


[mm] \Rightarrow P_{1}=(1,2,3,4) [/mm]



Meine Lösungen:


zu a) 1.00

zu b) 5.65

zu c) 5.00

zu d) Objekte: (1) und (2), Klassen: (1,2),(3),(4)

zu e) 5.65

zu f) Objekte: (3) und (4), Klassen: (1,2),(3,4)

zu g) 5.65

zu h) Objekte: (1,2) und (3,4), Klassen: (1,2,3,4)

zu i) 1.00




Vielen Dank im Voraus!





Gruß, Marcel

Dateianhänge:
Anhang Nr. 1 (Typ: jpg) [nicht öffentlich]
        
Bezug
Clusteranalyse: Skizze
Status: (Antwort) fertig Status 
Datum: 12:41 Do 09.07.2009
Autor: Al-Chwarizmi

Hallo Marcel,

das scheint alles zu stimmen. Für die Kon-
trolle brauchte ich keinen Rechner. Ich habe
mir dazu die Punkte A,B,C,D auf kariertem
Papier skizziert. Da sieht man sofort, dass
AB die kürzeste und AD die längste Ver-
bindungsstrecke ist. Ihre Längen bekommt
man mit Pythagoras. Auch die City-Block-
Distanzen zwischen den verschiedenen
Punkten sind leicht ersichtlich.

LG    

Bezug
                
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 12:49 Do 09.07.2009
Autor: Marcel08

Okay, vielen Dank soweit. Ich habe in der Zwischenzeit meinen Eintrag nochmal erweitert. Für weitere Korrekturhinweise wäre ich sehr dankbar.



Gruß, Marcel

Bezug
        
Bezug
Clusteranalyse: Aufgabenblatt
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 12:47 Do 09.07.2009
Autor: Marcel08

Ein erweitertes Aufgabenblatt liegt dem ersten Eintrag als Anhang bei.

Bezug
        
Bezug
Clusteranalyse: Antwort
Status: (Antwort) fertig Status 
Datum: 13:17 Do 09.07.2009
Autor: Al-Chwarizmi


> Wir haben [mm]D=\pmat{ 0 & 1 & 4.24 & 5.65 \\ 1 & 0 & 3.61 & 5 \\ 4.24 & 3.61 & 0 & 1.41 \\ 5.65 & 5 & 1.41 & 0 }[/mm]


Dies ist die euklidische Distanzmatrix.
Wenn ich richtig gelesen habe, soll die
Clusteranalyse aber aufgrund der
City-Block-Metrik erfolgen ...


> Fusionsschritt 1: Die kleinste Distanz (ausgenommen die
> Einträge der Hauptdiagonalen) ist [mm]d_{12}=1[/mm]
>  
>
> [mm]\Rightarrow[/mm] (1) und (2) werden verschmolzen.
>  
> [mm]\Rightarrow P_{3}=((1,2),(3),(4))[/mm]
>  
> [mm]\Rightarrow D_{(1,2),(3)}=max(4.24,3.61)=4.24[/mm]
>  
> [mm]\Rightarrow D_{(1,2),(4)}=max(5.65,5.00)=5.65[/mm]
>  
>
>
> Es ergibt sich die folgende Distanzmatrix
>  
>
> [mm]\pmat{ 0 & 4.24 & 5.65 \\ 4.24 & 0 & 1.41 \\ 5.65 & 1.41 & 0 }[/mm]
>  
>
> Fusionsschritt 2: Die kleinste Distanz der Distanzmatrix
> (ausgenommen der Einträge der Hauptdiagonalen) ist
> [mm]d_{34}=1.41[/mm]
>  
>
> [mm]\Rightarrow[/mm] (3) und (4) werden verschmolzen.
>  
> [mm]\Rightarrow P_{2}=((1,2),(3,4))[/mm]
>  
> [mm]\Rightarrow D_{(1,2),(3,4)}=max(4.24,5.65)=5.65[/mm]


Bezug
                
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 15:47 Do 09.07.2009
Autor: oLman

So, habe die Aufgabe jetzt nochmal nach City Metrix Distanzmatrix durchgerechnet:

     A B C D
$ [mm] D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 } [/mm] $

1. Fusions Schritt:

--> 8 wählen {A,D} verschmelzen

[mm] D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 } [/mm]

Rechenbeispiel:

[mm] d_{AD,C}= max{(d_{AC},d_{DC}}) [/mm] = 6

2. Fusions Schritt:

-> 7 wählen {AD,B} verschmelzen

[mm] D*=\pmat{ 0 & 6 \\ 6 & 0 } [/mm]

3 Fusions Schritt:

-> 6 wählen { ADB,C} verschmelzen

Ergebnis = 6

Ist das so korrekt?

lg
olman



Bezug
                        
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 15:58 Do 09.07.2009
Autor: Al-Chwarizmi


> So, habe die Aufgabe jetzt nochmal nach City Metrix
> Distanzmatrix durchgerechnet:
>  
> A B C D
>  [mm]D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 }[/mm]     [ok]
>  
> 1. Fusions Schritt:
>  
> --> 8 wählen {A,D} verschmelzen       [verwirrt]    [kopfschuettel]
>  
> [mm]D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }[/mm]
>  
> Rechenbeispiel:
>  
> [mm]d_{AD,C}= max{(d_{AC},d_{DC}})[/mm] = 6
>  
> 2. Fusions Schritt:
>  
> -> 7 wählen {AD,B} verschmelzen
>  
> [mm]D*=\pmat{ 0 & 6 \\ 6 & 0 }[/mm]
>  
> 3 Fusions Schritt:
>  
> -> 6 wählen { ADB,C} verschmelzen
>  
> Ergebnis = 6
>  
> Ist das so korrekt?
>  
> lg
>  olman



Ich denke, die Reihenfolge der Fusionen sollte
doch bei der kleinsten Distanz beginnen,
nicht bei der größten !

Bezug
                                
Bezug
Clusteranalyse: Verbesserungsvorschlag
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:21 Do 09.07.2009
Autor: Marcel08


> > So, habe die Aufgabe jetzt nochmal nach City Metrix
> > Distanzmatrix durchgerechnet:
>  >  
> > A B C D
>  >  [mm]D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 }[/mm]
>     [ok]
>  >  



1. Fusions Schritt:


Hier würde ich [mm] d_{12}=1 [/mm] wählen als kleinste Distanz.


[mm] \Rightarrow [/mm] (1) und (2) verschmelzen.

[mm] \Rightarrow P_{3}=((1,2),(3),(4)) [/mm]

[mm] \Rightarrow D_{(1,2)(3)}=max(6,5)=6 [/mm]

[mm] \Rightarrow D_{(1,2)(4)}=max(8,7)=8 [/mm]



Die neue Distanzmatrix sähe dann wie folgt aus:


[mm] D=\pmat{ 0 & 6 & 8 \\ 6 & 0 & 2 \\ 8 & 2 & 0} [/mm]



2. Fusionsschritt:


Kleinste Distanz mit [mm] d_{34}=2 [/mm] wählen.


[mm] \Rightarrow [/mm] (3) und (4) verschmelzen.

[mm] \Rightarrow P_{2}=(1,2)(3,4) [/mm]

[mm] \Rightarrow D_{1,2)(3,4)}=max(6,8)=8 [/mm]



Die neue Matrix würden dann lauten:


[mm] \pmat{ 0 & 8 \\ 8 & 0 } [/mm]



3. Fusionsschritt: Kleinste Distanz mit [mm] d_{(1,2)(3,4)}=8 [/mm] wählen.


[mm] \Rightarrow [/mm] (1,2) und (3,4) verschmelzen.

[mm] \Rightarrow P_{1}=(1,2,3,4) [/mm]




Das wäre mein Vorschlag dazu.





Gruß, Marcel



Vielleicht noch eine kleine Frage dazu:


Ist es denn nicht von vornherein klar, welche Distanzmatrix man nach dem 2. Fusionsschritt erhalten würde? Wenn man im Zuge des Complete-Linkage-Verfahrens bei der Neubestimmung der Distanzmatrix eh immer das Maximum nimmt, ist es doch klar, dass am Ende die 8 (in diesem Beispiel) übrig bleibt, oder sehe ich das falsch?

Analog auch zum Single-Linkage-Verfahren, wo ich mal schätze würde, dass im Zuge des vorliegenden Beispiels die Matrix


[mm] \pmat{ 0 & 1 \\ 1 & 0 } [/mm]


herauskommen würde.



Im Average-Linkage-Verfahren würde ich mal tippen


[mm] \pmat{ 0 & 5 \\ 5 & 0 } [/mm]


Wie gesagt, eine reine Vermutung. Über eine Aufklärung wäre ich sehr dankbar.





> > --> 8 wählen {A,D} verschmelzen       [verwirrt]    
> [kopfschuettel]
>  >  
> > [mm]D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }[/mm]
>  >  
> > Rechenbeispiel:
>  >  
> > [mm]d_{AD,C}= max{(d_{AC},d_{DC}})[/mm] = 6
>  >  
> > 2. Fusions Schritt:
>  >  
> > -> 7 wählen {AD,B} verschmelzen
>  >  
> > [mm]D*=\pmat{ 0 & 6 \\ 6 & 0 }[/mm]
>  >  
> > 3 Fusions Schritt:
>  >  
> > -> 6 wählen { ADB,C} verschmelzen
>  >  
> > Ergebnis = 6
>  >  
> > Ist das so korrekt?
>  >  
> > lg
>  >  olman
>  
>
>
> Ich denke, die Reihenfolge der Fusionen sollte
>  doch bei der kleinsten Distanz beginnen,
>  nicht bei der größten !


Bezug
                                        
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:28 Do 09.07.2009
Autor: Marcel08


> > > So, habe die Aufgabe jetzt nochmal nach City Metrix
> > > Distanzmatrix durchgerechnet:
>  >  >  
> > > A B C D
>  >  >  [mm]D=\pmat{ 0 & 1 & 6 & 8 \\ 1 & 0 & 5 & 7 \\ 6 & 5 & 0 & 2 \\ 8 & 7 & 2 & 0 }[/mm]
> >     [ok]

>  >  >  
>
>
>
> 1. Fusions Schritt:
>  
>
> Hier würde ich [mm]d_{12}=1[/mm] wählen als kleinste Distanz.
>  
>
> [mm]\Rightarrow[/mm] (1) und (2) verschmelzen.
>  
> [mm]\Rightarrow P_{3}=((1,2),(3),(4))[/mm]
>  
> [mm]\Rightarrow D_{(1,2)(3)}=max(6,5)=6[/mm]
>  
> [mm]\Rightarrow D_{(1,2)(4)}=max(8,7)=8[/mm]
>  
>
>
> Die neue Distanzmatrix sähe dann wie folgt aus:
>  
>
> [mm]D=\pmat{ 0 & 6 & 8 \\ 6 & 0 & 2 \\ 8 & 2 & 0}[/mm]
>  
>
>
> 2. Fusionsschritt:
>
>
> Kleinste Distanz mit [mm]d_{34}=2[/mm] wählen.
>  
>
> [mm]\Rightarrow[/mm] (3) und (4) verschmelzen.
>  
> [mm]\Rightarrow P_{2}=(1,2)(3,4)[/mm]
>  
> [mm]\Rightarrow D_{1,2)(3,4)}=max(6,8)=8[/mm]
>  
>
>
> Die neue Matrix würden dann lauten:
>  
>
> [mm]\pmat{ 0 & 8 \\ 8 & 0 }[/mm]
>  
>
>
> 3. Fusionsschritt: Kleinste Distanz mit [mm]d_{(1,2)(3,4)}=8[/mm]
> wählen.
>  
>
> [mm]\Rightarrow[/mm] (1,2) und (3,4) verschmelzen.
>  
> [mm]\Rightarrow P_{1}=(1,2,3,4)[/mm]
>  
>
>
>
> Das wäre mein Vorschlag dazu.
>  
>
>
>
>
> Gruß, Marcel
>  
>
>
> Vielleicht noch eine kleine Frage dazu:
>  
>
> Ist es denn nicht von vornherein klar, welche Distanzmatrix
> man nach dem 2. Fusionsschritt erhalten würde? Wenn man im
> Zuge des Complete-Linkage-Verfahrens bei der Neubestimmung
> der Distanzmatrix eh immer das Maximum nimmt, ist es doch
> klar, dass am Ende die 8 (in diesem Beispiel) übrig
> bleibt, oder sehe ich das falsch?
>  
> Analog auch zum Single-Linkage-Verfahren, wo ich mal
> schätze würde, dass im Zuge des vorliegenden Beispiels
> die Matrix
>  
>
> [mm]\pmat{ 0 & 1 \\ 1 & 0 }[/mm]
>  
>
> herauskommen würde.
>  
>
>
> Im Average-Linkage-Verfahren würde ich mal tippen
>  
>
> [mm]\pmat{ 0 & 5 \\ 5 & 0 }[/mm]
>  
>
> Wie gesagt, eine reine Vermutung. Über eine Aufklärung
> wäre ich sehr dankbar.
>  

Hat sich erledigt. :-)

>
> > > --> 8 wählen {A,D} verschmelzen       [verwirrt]    
> > [kopfschuettel]
>  >  >  
> > > [mm]D*=\pmat{ 0 & 7 & 6 \\ 7 & 0 & 6 \\ 6 & 2 & 0 }[/mm]
>  >  >  
> > > Rechenbeispiel:
>  >  >  
> > > [mm]d_{AD,C}= max{(d_{AC},d_{DC}})[/mm] = 6
>  >  >  
> > > 2. Fusions Schritt:
>  >  >  
> > > -> 7 wählen {AD,B} verschmelzen
>  >  >  
> > > [mm]D*=\pmat{ 0 & 6 \\ 6 & 0 }[/mm]
>  >  >  
> > > 3 Fusions Schritt:
>  >  >  
> > > -> 6 wählen { ADB,C} verschmelzen
>  >  >  
> > > Ergebnis = 6
>  >  >  
> > > Ist das so korrekt?
>  >  >  
> > > lg
>  >  >  olman
>  >  
> >
> >
> > Ich denke, die Reihenfolge der Fusionen sollte
>  >  doch bei der kleinsten Distanz beginnen,
>  >  nicht bei der größten !
>  


Bezug
                                
Bezug
Clusteranalyse: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:32 Do 09.07.2009
Autor: oLman

Alles klar, hab jetzt auch 8 raus, mir war nicht bewusst dass immer die kleinste Distanz gewählt werden muss, ich dachte das ist vom verfahren abhängig (single linkage, complete linkage oder average linkage).

Besten Dank!

Bezug
Ansicht: [ geschachtelt ] | ^ Forum "mathematische Statistik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
www.unimatheforum.de
[ Startseite | Forum | Wissen | Kurse | Mitglieder | Team | Impressum ]