Estadísticas básicas del Corpus del Español en Estados Unidos (CORPEEU)
El CORPEEU suma un total de 92.228.251 palabras recogidas en 59.794 textos escritos o en transcripciones de entrevistas, medios o interacciones orales
· Por tipología textual, se divide en tres grandes grupos: Lengua escrita, tecleada y hablada. El siguiente gráfico muestra la distribución por número de palabras:
· Estas grandes áreas tipológicas se dividen igualmente en subáreas que se distribuyen de la siguiente manera por el número de palabras recogidas en cada una:
· El CORPEEU sigue las divisiones geográficas de los Estados Unidos establecidas por la Oficina del Censo. Por el momento la distribución geográfica del corpus por número de palabras queda recogida en el gráfico y tabla siguientes:
Región |
Palabras |
Textos/Transcripciones |
Pacífico (PAC) |
30.616.168 (33.19 %) |
19.373 |
Atlántico Medio (ATM) |
16.454.892 (17.84 %) |
8.203 |
Atlántico Sur (ATS) |
10.550.789 (11.43 %) |
6.008 |
Suroeste Central (SOC) |
9.133.701 (9.90 %) |
93.192 |
Noreste Central (NEC) |
7.257.953 (7.86 %) |
3.990 |
Montaña (MON) |
3.243.318 (3.51 %) |
1.733 |
Nueva Inglaterra (NIN) |
256.067 (0.27 %) |
198 |
Sureste Central (SEC) |
79.739 (0.087 %) |
52 |
Noroeste Central (NOC) |
556 (0.00060 %) |
17 |
Desconocida |
14.635.068 (15.86 %) |
17.028 |
TOTAL |
92.228.251 |
59.794 |
El CORPEEU trata de distribuirse teniendo en cuenta el número de población hispanohablante que vive en cada estado del país. He aquí la distribución del número de formas del corpus por estados:
Estado |
Palabras |
Porcentaje |
Alabama |
58258 |
0.06% |
Arizona |
2455251 |
2.66% |
California |
30616168 |
33.20% |
Connecticut |
115599 |
0.13% |
Delaware |
35454 |
0.04% |
District of Columbia |
16676 |
0.02% |
Florida |
9145451 |
9.92% |
Illinois |
6342923 |
6.88% |
Indiana |
673151 |
0.73% |
Massachusetts |
54054 |
0.06% |
Minnesota |
556 |
0.00% |
Nevada |
524154 |
0.57% |
New Jersey |
128794 |
0.14% |
New York |
16330755 |
17.71% |
North Carolina |
322251 |
0.35% |
Oklahoma |
31329 |
0.03% |
Pennsylvania |
48492 |
0.05% |
Rhode Island |
86414 |
0.09% |
South Carolina |
170846 |
0.19% |
Tennessee |
21481 |
0.02% |
Texas |
9107343 |
9.87% |
Utah |
217682 |
0.24% |
Washington DC |
852500 |
0.92% |
Winconsin |
241879 |
0.26% |
Otros |
14630790 |
15.86% |
Total |
92228251 |
100.00% |
Que puede compararse con la de la población hispanohablante de cada estado:
|
|