Estadísticas básicas del Corpus del Español en Estados Unidos (CORPEEU)

 

El CORPEEU suma un total de 92.228.251 palabras recogidas en 59.794 textos escritos o en transcripciones de entrevistas, medios o interacciones orales

 

·      Por tipología textual, se divide en tres grandes grupos: Lengua escrita, tecleada y hablada. El siguiente gráfico muestra la distribución por número de palabras:

 

 

·      Estas grandes áreas tipológicas se dividen igualmente en subáreas que se distribuyen de la siguiente manera por el número de palabras recogidas en cada una:

 

       

·      El CORPEEU sigue las divisiones geográficas de los Estados Unidos establecidas por la Oficina del Censo. Por el momento la distribución geográfica del corpus por número de palabras queda recogida en el gráfico y tabla siguientes:

 

       

Región

Palabras

Textos/Transcripciones

Pacífico (PAC)

30.616.168 (33.19 %)

19.373

Atlántico Medio (ATM)

16.454.892 (17.84 %)

8.203

Atlántico Sur (ATS)

10.550.789 (11.43 %)

6.008

Suroeste Central (SOC)

9.133.701 (9.90 %)

93.192

Noreste Central (NEC)

7.257.953 (7.86 %)

3.990

Montaña (MON)

3.243.318 (3.51 %)

1.733

Nueva Inglaterra (NIN)

256.067 (0.27 %)

198

Sureste Central (SEC)

79.739 (0.087 %)

52

Noroeste Central (NOC)

556 (0.00060 %)

17

Desconocida

14.635.068 (15.86 %)

17.028

TOTAL

92.228.251

59.794

 

 

 

El CORPEEU trata de distribuirse teniendo en cuenta el número de población hispanohablante que vive en cada estado del país. He aquí la distribución del número de formas del corpus por estados:

 

 

Estado

Palabras

Porcentaje

Alabama

58258

0.06%

Arizona

2455251

2.66%

California

30616168

33.20%

Connecticut

115599

0.13%

Delaware

35454

0.04%

District of Columbia

16676

0.02%

Florida

9145451

9.92%

Illinois

6342923

6.88%

Indiana

673151

0.73%

Massachusetts

54054

0.06%

Minnesota

556

0.00%

Nevada

524154

0.57%

New Jersey

128794

0.14%

New York

16330755

17.71%

North Carolina

322251

0.35%

Oklahoma

31329

0.03%

Pennsylvania

48492

0.05%

Rhode Island

86414

0.09%

South Carolina

170846

0.19%

Tennessee

21481

0.02%

Texas

9107343

9.87%

Utah

217682

0.24%

Washington DC

852500

0.92%

Winconsin

241879

0.26%

Otros

14630790

15.86%

Total

92228251

100.00%

 

 

Que puede compararse con la de la población hispanohablante de cada estado:

 

A black and white image

AI-generated content may be incorrect.

A map of the united states

AI-generated content may be incorrect.