Ley de Zipf: la verdad brutal sobre el vocabulario
El lingüista George Zipf observó en los años 40: en cada idioma, la frecuencia de palabras sigue un patrón dramático.
- Las 100 palabras más frecuentes son ~50 % de cualquier texto
- Las 1.000 más frecuentes cubren ~75 %
- Las 3.000 más frecuentes te llevan al ~85 %
- El último 5 % exige otras 20.000+ palabras
La verdad cruda: 1000 palabras cubren el 75 %, las 4000 siguientes sólo el 10 % final.
Traducción: si aprendes las 1000 palabras correctas, entiendes tres cuartas partes de lo que oyes. Si aprendes las equivocadas, quizás entiendas el 30 %.
¿Qué vocabulario aprender primero?
Las palabras de alta frecuencia son poco glamurosas – pero son el esqueleto del idioma:
- Pronombres, artículos, conjunciones (¡todas!)
- Verbos frecuentes: ser, estar, tener, hacer, ir, decir, ver, dar, venir…
- Adverbios frecuentes: ya, todavía, después, aquí, siempre, nunca, mucho, poco
- Adjetivos frecuentes: grande, pequeño, bueno, malo, nuevo, viejo, mucho, importante
Después: vocabulario temático (comida, viajes, trabajo) – y también por frecuencia, no en orden alfabético como el libro de texto.
Listas de frecuencia: dónde encontrarlas
- Español: Wiktionary Top 1000 Español, „A Frequency Dictionary of Spanish" (Routledge)
- Alemán: Leipziger Wortschatz, „Frequency Dictionary of German" (Routledge)
- Inglés: NGSL (New General Service List) – 2800 palabras para el 92 % de cobertura
Los límites de las listas de frecuencia
Con 1000–2000 palabras tienes el esqueleto. A partir de ahí la frecuencia importa menos: la palabra número 5000 aparece quizás cada 2 semanas. En esa etapa rinde más el input comprensible (podcasts, libros, series) – te dará justo las palabras que aparecen en tu vida.