matheraum.de
Raum für Mathematik
Offene Informations- und Nachhilfegemeinschaft

Für Schüler, Studenten, Lehrer, Mathematik-Interessierte.
Hallo Gast!einloggen | registrieren ]
Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum
Forenbaum
^ Forenbaum
Status Hochschulmathe
  Status Uni-Analysis
    Status Reelle Analysis
    Status UKomplx
    Status Uni-Kompl. Analysis
    Status Differentialgl.
    Status Maß/Integrat-Theorie
    Status Funktionalanalysis
    Status Transformationen
    Status UAnaSon
  Status Uni-Lin. Algebra
    Status Abbildungen
    Status ULinAGS
    Status Matrizen
    Status Determinanten
    Status Eigenwerte
    Status Skalarprodukte
    Status Moduln/Vektorraum
    Status Sonstiges
  Status Algebra+Zahlentheo.
    Status Algebra
    Status Zahlentheorie
  Status Diskrete Mathematik
    Status Diskrete Optimierung
    Status Graphentheorie
    Status Operations Research
    Status Relationen
  Status Fachdidaktik
  Status Finanz+Versicherung
    Status Uni-Finanzmathematik
    Status Uni-Versicherungsmat
  Status Logik+Mengenlehre
    Status Logik
    Status Mengenlehre
  Status Numerik
    Status Lin. Gleich.-systeme
    Status Nichtlineare Gleich.
    Status Interpol.+Approx.
    Status Integr.+Differenz.
    Status Eigenwertprobleme
    Status DGL
  Status Uni-Stochastik
    Status Kombinatorik
    Status math. Statistik
    Status Statistik (Anwend.)
    Status stoch. Analysis
    Status stoch. Prozesse
    Status Wahrscheinlichkeitstheorie
  Status Topologie+Geometrie
  Status Uni-Sonstiges

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Neuerdings beta neu
 Forum...
 vorwissen...
 vorkurse...
 Werkzeuge...
 Nachhilfevermittlung beta...
 Online-Spiele beta
 Suchen
 Verein...
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
StartseiteMatheForenMathe Klassen 8-10Normalisierung
Foren für weitere Schulfächer findest Du auf www.vorhilfe.de z.B. Informatik • Physik • Technik • Biologie • Chemie
Forum "Mathe Klassen 8-10" - Normalisierung
Normalisierung < Klassen 8-10 < Schule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "Mathe Klassen 8-10"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Normalisierung: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 18:04 Do 15.07.2004
Autor: jopeku

Hallo,

ich habe mich in diesem Forum registriert, weil ich
hoffe das ich hier auf kompetente Nutzer treffe die auch
mal eine - wahrscheinlich - etwas dümmliche Frage
beantworten ohne gleich Wein- oder Lachkrämpfe zu
bekommen.

Also hier mein winziges Problem:

Nehmen wir an, ich hätte einige Stichproben vorgenommen
und möchte die daraus gewonnen Werte miteinander vergleichen.

Die Stichproben haben z.B. folgenden Umfang:

768
2457
1534
12378
968

Um die gewonnen Werte miteinander vergleich zu können, möchte
ich die Stichproben "Normalisieren".....

Kann mir jemand, wenn bitte möglich, den Rechenweg hierzu
detailliert erklären?

danke für jede Hilfe

Ich habe diese Frage in keinem weiteren Forum gestellt.

        
Bezug
Normalisierung: - Antwortungsversuch
Status: (Antwort) fertig Status 
Datum: 22:55 Do 15.07.2004
Autor: baerchen

Hallo Jopeku,

ich weiß nicht, ob ich deine Frage richtig verstehe und lasse sie deshalb unbeantwortet, denn ich habe vom Normalisieren noch nie etwas gehört und auch mein Suchen im Internet half mir dabei nicht weiter.
Jedoch kann ich mir vielleicht dein Problem vorstellen.

Du hast fünf Stichproben genommen, von was auch immer. Du hast die folgenden Werte heraus:

768
2457
1534
12378
968

Um diese Werte besser miteinander vergleichen zu können, kannst du den Durschschnitt ausrechnen in dem du die fünf Werte addierst und die Summe dann durch 5 teilst.

Die fünf einzelnen Werte kannst du nun mit  dem Durschschnitt vergleichen und du siehst  leicht, welche Stichprobe z.B. stark vom Durschschnitt abweicht.

Ich hoffe, ich konnte dir damit helfen oder du findest jemanden, der wirklich die Lösung kennt.

Liebe Grüße

Bezug
                
Bezug
Normalisierung: - Antwortungsversuch
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 23:47 Do 15.07.2004
Autor: Marc

Hallo baerchen!

> ich weiß nicht, ob ich deine Frage richtig verstehe und
> lasse sie deshalb unbeantwortet, denn ich habe vom
> Normalisieren noch nie etwas gehört und auch mein Suchen im
> Internet half mir dabei nicht weiter.
> Jedoch kann ich mir vielleicht dein Problem vorstellen.
>  
> Du hast fünf Stichproben genommen, von was auch immer. Du
> hast die folgenden Werte heraus:
>  
> 768
>  2457
>  1534
>  12378
>  968

Ich denke, jopeku meinte mit diesen 5 Werten nicht die beobachteten Werte (selbst), sondern 5 verschiedene Stichprobenerhebungen, die erste bestehend aus 768 Stichproben, die zweite aus 2457 Stichproben etc.

Nun kenne ich mich mit dem Thema auch nicht aus, aber magisters Antwort hört sich für mich richtig an, jedenfalls hatte ich auch daran gedacht.

Viele Grüße,
Marc

Bezug
                        
Bezug
Normalisierung: - Antwortungsversuch
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 02:37 Fr 16.07.2004
Autor: jopeku

Hallo und danke für die Antworten

Ich denke ich muß mich präziesieren:

bei den Stichproben handelte es sich um Texte
der Stichprobenumfang gibt die Anzahl der Worte im Text wieder
ich erhalte natürlich nach meiner Formel verschiedene Werte je Text
z.B. 0,3873
0,04021
0,37387

usw.
Bei den ermittelten Werten ist natürlich die Anzahl der Worte
entscheiden, der die Werte beeinflußt. Ich möchte also, die Werte
so miteinander vergleichen, als wenn die Stichprobe der unterschidelichen
Texte gleich groß wäre.....

oh je, habe ich das was ich will, rüber gebracht????

Also, wie verhält sich Wert 1 zu Wert 2 wenn der Umfangb der Stichprobe
unterschiedlich groß ist???

Ich bin kein Mathematiker, sonder schreibe ein Programm
zur Auswertung von Texten.... nicht kommerziell sondern aus Lust and
der Feude....

danke für jeden der mir geholfen hat

Bezug
        
Bezug
Normalisierung: Antwort
Status: (Antwort) fertig Status 
Datum: 22:57 Do 15.07.2004
Autor: magister

hallo

also du hast geschrieben, du hast 5 Stichproben mit folgendem Umfang:

768
2457
1534
12378
968

stichproben werden standardisiert, indem man vom jeweils aktuellen wert der stichprobe den mittelwert der stichprobe subtrahiert und durch die Stichprobenstandarabweichung dividiert.

beispiel

vektor (4,5,6) ........also 3 stichprobenwerte
mittelwert ist 5
standarabweichung ist 2

also sind die normierten werte -0.5 , 0 , 0.5  

das machst du mit allen 5 stichproben und dann kannst du die werte miteinander vergleichen


Bezug
        
Bezug
Normalisierung: Antwort
Status: (Antwort) fertig Status 
Datum: 10:57 Fr 16.07.2004
Autor: magister

hi jopeku

ich versuche deinen wunsch mal zu deuten:

5 texte, mit je folgender wortanzahl

768
2457
1534
12378
968


<Bei den ermittelten Werten ist natürlich die Anzahl der
<Worte
<entscheiden, der die Werte beeinflußt. Ich möchte also, die Werte
<so miteinander vergleichen, als wenn die Stichprobe der
<unterschidelichen Texte gleich groß wäre.....

<oh je, habe ich das was ich will, rüber gebracht????

<Also, wie verhält sich Wert 1 zu Wert 2 wenn der Umfang der
<Stichprobe unterschiedlich groß ist???


also wenn ich dich richtig verstehe, handelt es sich hier um einen normalen schlußrechnungsvergleich, oder nicht ?dann kannst du zwei werte, egal welcher größe miteinander vergleichen
bsp 2457 : 768  verhält sich so wie  3,2 :1

hilft dir das weiter ??

falls nicht, schreibs und wir überlegen uns was neues..

lg magister


Bezug
                
Bezug
Normalisierung: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 12:10 Fr 16.07.2004
Autor: jopeku

Hallo,

auf was habe ich mich da blos eingelassen??

Doch zuerst danke für die umfangreiche Hilfe.

Es geht bei meinem Problem um statitische Vergleiche.
In der Literatur und auch im Internet wird durch Mathematiker
- der ich nun mal nicht bin - darauf hingewiesen, das unterschidliche
Stichprobenumfänge und die daraus gewonnenen Werte dadurch
vergleichbar gemacht werden können, das man die Werte durch
Transformation "normalisieren" kann.

So gut, so schön.


Ich habe hier einen Link, verstehe aber nur Bahnhof :-)

http://www.unibw-hamburg.de/WWEB/math/uebe/Intranet/Vorlesungen/Kap-16-Konfidenz.pdf

Mein Programm erzeugt einige hundert Ergebnisse aus den untersuchten Texten. Da alle Texte jedoch unterschiedlich groß sind, sollen die
Ergebnisse der Untersuchungen vergleichbar gemacht werden....

Ich glaube, ich gebe besser auf....

Bezug
        
Bezug
Normalisierung: Antwort
Status: (Antwort) fertig Status 
Datum: 12:26 Fr 16.07.2004
Autor: taenzer

Ich versuche es mal mit einem konkreten Beispiel:

Du willst z.B. wissen, in welchem Text die meisten A auftauchen. Nun sind aber die Texte unterschiedlich lang und daher macht der einfache Vergleich der gezählten A aus den verschiedenen Texten keinen Sinn. Soweit richtig?

Wenn Du nun die A-Häufigkeit der verschiedenen Texte vergleichen willst, musst Du die Zahl der gezählten A durch die Gesamtzahl der Buchstaben des jeweiligen Textes teilen. Damit hast Du die A-Häufigkeit normalisiert. (Anmerkung: die gezählten A heissen absolute Häufigkeit, die durch die Gesamtzahl der Buchstaben dividierten A heissen relative Häufigkeit).

Ist das das, was Du meinst?

Gruß

Christian


Bezug
                
Bezug
Normalisierung: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 12:49 Fr 16.07.2004
Autor: jopeku

Hallo,

das mit der relativen Häufigkeit hört sich logisch an.

Die Werte die ich ermittle sind aber Mittelwerte aus diesem Text,
gilt dieses Verfashren dann auch??

Ich denke eher nicht oder??

Bezug
                        
Bezug
Normalisierung: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 12:58 Fr 16.07.2004
Autor: taenzer


> Hallo,
>  
> das mit der relativen Häufigkeit hört sich logisch an.
>  
> Die Werte die ich ermittle sind aber Mittelwerte aus diesem
> Text,
>  gilt dieses Verfashren dann auch??

Was sind denn das für Werte. Mittelwerte von welcher Messung?
Gib mal ein Beispiel an.

> Ich denke eher nicht oder??


Gruß

Christian


Bezug
                                
Bezug
Normalisierung: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 13:18 Fr 16.07.2004
Autor: jopeku

Genau genommen handelt es sich um die Entropie des Wortes im Text,
als die durchschnittliche Entropie des Textes, eine Erläuterung findet man hier:

http://www.cl.uni-heidelberg.de/kurs/ws03/statistik/html/page032.html

Ich ermittle für jedes Wort die Entropie und summiere diese auf.
Anschließend dividiere ich das Ergebnis durch die Anzahl der Worte

Bezug
                                        
Bezug
Normalisierung: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 13:44 Fr 16.07.2004
Autor: taenzer

Eigentlich ist die Entropie schon eine Größe, die man zwische verschiedenen Systemen vergleichen kann. Aber ich mag mich irren.

Aber welche Größe ist der Mittelwert der Entropien aller Wörter in einem System. Welche Aussage hat das?

Bezug
                                                
Bezug
Normalisierung: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 14:00 Fr 16.07.2004
Autor: jopeku

In der Computerlinguistik kennzeichnet die Entropie den Informationsgehalt einer NachrichtTextes.

Man versucht über verschiedene Methoden, - quantitative Computerlinguistik - Aussagen über verschiedene Texte zu
erhalten.


Bezug
                                                        
Bezug
Normalisierung: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 14:16 Fr 16.07.2004
Autor: taenzer

Dann gibt aber der Mittelwert der Entropie der Wörter nicht den Informationsgehalt des Textes wider, denn die Definition der Entropie ist, wie aus dem Text hervorgeht, vom Logarithmus der Wahrscheinlichkeit abhängig.

Ich glaube, Du hast die Frage im falsche Forum gestellt. Versuche es doch mal im Forum Uni-Stochastik.

Gruß

Christian

Bezug
                                                                
Bezug
Normalisierung: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 15:02 Fr 16.07.2004
Autor: jopeku

ja, ein sehr häufig auftrendes Wort wie z.B. der, die, und es usw.
besitz ein Informationsgehalt von fast 0. Ein Wort wie besipielsweise
"Chrommittelstange" ein sehr viel höeren Informationsgehalt, weil
seine Häufigkeit in einem Text eher gering ist.

Danke für die Unterstützung

Bezug
Ansicht: [ geschachtelt ] | ^ Forum "Mathe Klassen 8-10"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
www.unimatheforum.de
[ Startseite | Forum | Wissen | Kurse | Mitglieder | Team | Impressum ]