Normalisierung < Klassen 8-10 < Schule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 18:04 Do 15.07.2004 | Autor: | jopeku |
Hallo,
ich habe mich in diesem Forum registriert, weil ich
hoffe das ich hier auf kompetente Nutzer treffe die auch
mal eine - wahrscheinlich - etwas dümmliche Frage
beantworten ohne gleich Wein- oder Lachkrämpfe zu
bekommen.
Also hier mein winziges Problem:
Nehmen wir an, ich hätte einige Stichproben vorgenommen
und möchte die daraus gewonnen Werte miteinander vergleichen.
Die Stichproben haben z.B. folgenden Umfang:
768
2457
1534
12378
968
Um die gewonnen Werte miteinander vergleich zu können, möchte
ich die Stichproben "Normalisieren".....
Kann mir jemand, wenn bitte möglich, den Rechenweg hierzu
detailliert erklären?
danke für jede Hilfe
Ich habe diese Frage in keinem weiteren Forum gestellt.
|
|
|
|
Hallo Jopeku,
ich weiß nicht, ob ich deine Frage richtig verstehe und lasse sie deshalb unbeantwortet, denn ich habe vom Normalisieren noch nie etwas gehört und auch mein Suchen im Internet half mir dabei nicht weiter.
Jedoch kann ich mir vielleicht dein Problem vorstellen.
Du hast fünf Stichproben genommen, von was auch immer. Du hast die folgenden Werte heraus:
768
2457
1534
12378
968
Um diese Werte besser miteinander vergleichen zu können, kannst du den Durschschnitt ausrechnen in dem du die fünf Werte addierst und die Summe dann durch 5 teilst.
Die fünf einzelnen Werte kannst du nun mit dem Durschschnitt vergleichen und du siehst leicht, welche Stichprobe z.B. stark vom Durschschnitt abweicht.
Ich hoffe, ich konnte dir damit helfen oder du findest jemanden, der wirklich die Lösung kennt.
Liebe Grüße
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 23:47 Do 15.07.2004 | Autor: | Marc |
Hallo baerchen!
> ich weiß nicht, ob ich deine Frage richtig verstehe und
> lasse sie deshalb unbeantwortet, denn ich habe vom
> Normalisieren noch nie etwas gehört und auch mein Suchen im
> Internet half mir dabei nicht weiter.
> Jedoch kann ich mir vielleicht dein Problem vorstellen.
>
> Du hast fünf Stichproben genommen, von was auch immer. Du
> hast die folgenden Werte heraus:
>
> 768
> 2457
> 1534
> 12378
> 968
Ich denke, jopeku meinte mit diesen 5 Werten nicht die beobachteten Werte (selbst), sondern 5 verschiedene Stichprobenerhebungen, die erste bestehend aus 768 Stichproben, die zweite aus 2457 Stichproben etc.
Nun kenne ich mich mit dem Thema auch nicht aus, aber magisters Antwort hört sich für mich richtig an, jedenfalls hatte ich auch daran gedacht.
Viele Grüße,
Marc
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 02:37 Fr 16.07.2004 | Autor: | jopeku |
Hallo und danke für die Antworten
Ich denke ich muß mich präziesieren:
bei den Stichproben handelte es sich um Texte
der Stichprobenumfang gibt die Anzahl der Worte im Text wieder
ich erhalte natürlich nach meiner Formel verschiedene Werte je Text
z.B. 0,3873
0,04021
0,37387
usw.
Bei den ermittelten Werten ist natürlich die Anzahl der Worte
entscheiden, der die Werte beeinflußt. Ich möchte also, die Werte
so miteinander vergleichen, als wenn die Stichprobe der unterschidelichen
Texte gleich groß wäre.....
oh je, habe ich das was ich will, rüber gebracht????
Also, wie verhält sich Wert 1 zu Wert 2 wenn der Umfangb der Stichprobe
unterschiedlich groß ist???
Ich bin kein Mathematiker, sonder schreibe ein Programm
zur Auswertung von Texten.... nicht kommerziell sondern aus Lust and
der Feude....
danke für jeden der mir geholfen hat
|
|
|
|
|
hallo
also du hast geschrieben, du hast 5 Stichproben mit folgendem Umfang:
768
2457
1534
12378
968
stichproben werden standardisiert, indem man vom jeweils aktuellen wert der stichprobe den mittelwert der stichprobe subtrahiert und durch die Stichprobenstandarabweichung dividiert.
beispiel
vektor (4,5,6) ........also 3 stichprobenwerte
mittelwert ist 5
standarabweichung ist 2
also sind die normierten werte -0.5 , 0 , 0.5
das machst du mit allen 5 stichproben und dann kannst du die werte miteinander vergleichen
|
|
|
|
|
hi jopeku
ich versuche deinen wunsch mal zu deuten:
5 texte, mit je folgender wortanzahl
768
2457
1534
12378
968
<Bei den ermittelten Werten ist natürlich die Anzahl der
<Worte
<entscheiden, der die Werte beeinflußt. Ich möchte also, die Werte
<so miteinander vergleichen, als wenn die Stichprobe der
<unterschidelichen Texte gleich groß wäre.....
<oh je, habe ich das was ich will, rüber gebracht????
<Also, wie verhält sich Wert 1 zu Wert 2 wenn der Umfang der
<Stichprobe unterschiedlich groß ist???
also wenn ich dich richtig verstehe, handelt es sich hier um einen normalen schlußrechnungsvergleich, oder nicht ?dann kannst du zwei werte, egal welcher größe miteinander vergleichen
bsp 2457 : 768 verhält sich so wie 3,2 :1
hilft dir das weiter ??
falls nicht, schreibs und wir überlegen uns was neues..
lg magister
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:10 Fr 16.07.2004 | Autor: | jopeku |
Hallo,
auf was habe ich mich da blos eingelassen??
Doch zuerst danke für die umfangreiche Hilfe.
Es geht bei meinem Problem um statitische Vergleiche.
In der Literatur und auch im Internet wird durch Mathematiker
- der ich nun mal nicht bin - darauf hingewiesen, das unterschidliche
Stichprobenumfänge und die daraus gewonnenen Werte dadurch
vergleichbar gemacht werden können, das man die Werte durch
Transformation "normalisieren" kann.
So gut, so schön.
Ich habe hier einen Link, verstehe aber nur Bahnhof
http://www.unibw-hamburg.de/WWEB/math/uebe/Intranet/Vorlesungen/Kap-16-Konfidenz.pdf
Mein Programm erzeugt einige hundert Ergebnisse aus den untersuchten Texten. Da alle Texte jedoch unterschiedlich groß sind, sollen die
Ergebnisse der Untersuchungen vergleichbar gemacht werden....
Ich glaube, ich gebe besser auf....
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 12:26 Fr 16.07.2004 | Autor: | taenzer |
Ich versuche es mal mit einem konkreten Beispiel:
Du willst z.B. wissen, in welchem Text die meisten A auftauchen. Nun sind aber die Texte unterschiedlich lang und daher macht der einfache Vergleich der gezählten A aus den verschiedenen Texten keinen Sinn. Soweit richtig?
Wenn Du nun die A-Häufigkeit der verschiedenen Texte vergleichen willst, musst Du die Zahl der gezählten A durch die Gesamtzahl der Buchstaben des jeweiligen Textes teilen. Damit hast Du die A-Häufigkeit normalisiert. (Anmerkung: die gezählten A heissen absolute Häufigkeit, die durch die Gesamtzahl der Buchstaben dividierten A heissen relative Häufigkeit).
Ist das das, was Du meinst?
Gruß
Christian
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:49 Fr 16.07.2004 | Autor: | jopeku |
Hallo,
das mit der relativen Häufigkeit hört sich logisch an.
Die Werte die ich ermittle sind aber Mittelwerte aus diesem Text,
gilt dieses Verfashren dann auch??
Ich denke eher nicht oder??
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:58 Fr 16.07.2004 | Autor: | taenzer |
> Hallo,
>
> das mit der relativen Häufigkeit hört sich logisch an.
>
> Die Werte die ich ermittle sind aber Mittelwerte aus diesem
> Text,
> gilt dieses Verfashren dann auch??
Was sind denn das für Werte. Mittelwerte von welcher Messung?
Gib mal ein Beispiel an.
> Ich denke eher nicht oder??
Gruß
Christian
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:18 Fr 16.07.2004 | Autor: | jopeku |
Genau genommen handelt es sich um die Entropie des Wortes im Text,
als die durchschnittliche Entropie des Textes, eine Erläuterung findet man hier:
http://www.cl.uni-heidelberg.de/kurs/ws03/statistik/html/page032.html
Ich ermittle für jedes Wort die Entropie und summiere diese auf.
Anschließend dividiere ich das Ergebnis durch die Anzahl der Worte
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:44 Fr 16.07.2004 | Autor: | taenzer |
Eigentlich ist die Entropie schon eine Größe, die man zwische verschiedenen Systemen vergleichen kann. Aber ich mag mich irren.
Aber welche Größe ist der Mittelwert der Entropien aller Wörter in einem System. Welche Aussage hat das?
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 14:00 Fr 16.07.2004 | Autor: | jopeku |
In der Computerlinguistik kennzeichnet die Entropie den Informationsgehalt einer NachrichtTextes.
Man versucht über verschiedene Methoden, - quantitative Computerlinguistik - Aussagen über verschiedene Texte zu
erhalten.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 14:16 Fr 16.07.2004 | Autor: | taenzer |
Dann gibt aber der Mittelwert der Entropie der Wörter nicht den Informationsgehalt des Textes wider, denn die Definition der Entropie ist, wie aus dem Text hervorgeht, vom Logarithmus der Wahrscheinlichkeit abhängig.
Ich glaube, Du hast die Frage im falsche Forum gestellt. Versuche es doch mal im Forum Uni-Stochastik.
Gruß
Christian
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:02 Fr 16.07.2004 | Autor: | jopeku |
ja, ein sehr häufig auftrendes Wort wie z.B. der, die, und es usw.
besitz ein Informationsgehalt von fast 0. Ein Wort wie besipielsweise
"Chrommittelstange" ein sehr viel höeren Informationsgehalt, weil
seine Häufigkeit in einem Text eher gering ist.
Danke für die Unterstützung
|
|
|
|