Title: Aproximndose a la aculturacin mediante medidas de composicin y estructura de las redes personales
1Aproximándose a la aculturación mediante medidas
de composición y estructura de las redes
personales
National Science Foundation, Award No. BCS-0417429
- Chris McCarty
- University of Florida
- Jose Luis Molina y Miranda Lubbers
- Universitat Autonoma de Barcelona
2Esta presentación tiene cuatro partes
- Una visión de conjunto de la investigación en
ciencias sociales - Una visión de conjunto de las redes sociales
- Una introducción al análisis de redes
sociocéntricas - Una introducción al análisis de redes personales
- Una presentación de Egonet
3- La mayor parte de la investigación en ciencias
sociales está diseñada para predecir actitudes,
conductas o condiciones de personas a partir de
sus características. - Los científicos sociales preguntan u observan
características acerca de respondientes y
utilizan esa variabilidad en esas características
para explicar las variables dependientes
4Ejemplo de un diseño de investigación
Edad Formación Ingresos Altura Peso
Número de cigarrillos que fuma cada día
Variable dependiente
Variables independientes
- Un/a científico/a social puede recoger
información sobre una muestra de 500
respondientes e intentar predecir su conducta
fumadora utilizando la variabilidad en su edad,
formación, ingresos, altura y peso
5Conclusión
Edad Formación Ingresos Peso Altura
Número de cigarrilos que fuma cada día
Variables independientes
Variable dependiente
- El/la investigador/a concluye que la edad, el
nivel de formación y los ingresos son buenos
predictores de cuántos cigarrilos fuma cada día,
mientras que el peso y la altura no lo son.
6Influencia social
- Los científicos sociales piensan que algunas
variables dependientes están influenciadas por
factores sociales. - Por ejemplo, está comúnmente aceptado que la
introducción al hábito de fumar entre
adolescentes es debido a la influencia de los
colegas. - Dado que la influencia de los colegas no se puede
observar de formar directa, los científicos
socials diseñan preguntas que pueden ser
utilizadas como aproximaciones para observar la
influencia de los colegas.
7Preguntas proxy (indicadoras)
- Fuman tus padres? (Padres)
- Fuma la mayor parte de tus amigos? (Amigos)
- Alguno de tus amigos te ha ofrecido alguna vez
un cigarrillo? (Ofrecimiento)
8Poder predictivo de la influencia social
Edad Formación Ingresos Padres Amigos Ofrecimiento
Número de cigarrilos que fuma cada día
Variable dependiente
Variables independientes
- Los investigadores/as han descubierto que estas
preguntas aproximativas explican parte de una
varianza previamente inexplicada en relación al
hábito de fumar por la edad, la formación y los
ingresos.
9Preguntas
- Conocer más detalles sobre la influencia social
que rodea a un respondiente nos proporciona más
poder explicativo? - Qué preguntas podemos hacer para conseguir esta
clase de detalle? - Proponemos utilizar la aproximación de las redes
sociales.
10Dos tipos de análisis de redes sociales
- Análisis sociocéntrico (redes completas)
- Se centra en la interacción dentro del grupo
- Recoge información de los miembros de un grupos
acerca de sus relaciones con el resto de miembros
- Análisis de redes personales
- Se centra en los efectos de la red en las
actitudes individuales, conductas y condiciones - Recoge información sobre el respondiente (ego)
acerca de sus interacciones con los miembros de
la red (alteri)
11Aproximación sociocéntrica al hábito de fumar y
la influencia social
- Selección de un grupo de estudiantes dentro de
una clase. - Preguntar a cada estudiante que puntúe en una
escala de 0 a 5 cuánto se socializa con cada uno
de los otros. - Preguntar a los estudiantes si fuman o no.
12Matriz de adyacencia de estudiantes
- Las evaluaciones realizadas por cada persona
pueden ser usadas para construir una matriz que
represente las relaciones entre los miembros de
la clase - Las celdas que interseccionan dos personas
representan la valoración realizada - David dice que se socializa con Faith a un nivel
2 - Faith dice que se socializa con David a un nivel
1
13Visualización de la red
- Podemos usar la matriz para visualizar la
estructura de relaciones - Hay un gran grupo en el centro.
- Amber y Beth fuman
- Napp no se socializa con nadie y Thomas y Kent
sólo se socializan entre ellos dos
14Visualización de la red
- Podemos calcular algunas medidas de esta
estructura - Hay dos componentes de la red
- Beth es la que tiene un grado nodal más alto
- Amber es la que tiene un grado de intermediación
más alto
15Conclusión
- Podemos concluir que aquéllos que forman parte
del grupo de Beth y Amber es más probable que
fumen. - Napp, Kent y Thomas no.
- Este análisis no dice nada de las influencias
fuera del grupo. - Para estudiar las influencias a través de grupos
utilizamos análisis de redes personales.
16Tom tiene una Red Personal de 10 personas
17Tom se encuentra con esas personas en tres grupos
18Dentro de cada grupo se conocen todos
CLUB
FAMILY
WORK
19Hay también algunas relaciones entre grupos
CLUB
WORK
FAMILY
20A veces las redes personales pueden ser complejas
21Introducción a la recolección de datos de redes
personales
- Identificar una población
- Seleccionar una muestra de respondientes
- Preguntas sobre cada respondiente
- Obtener miembros de la red personal
- Preguntar sobre cada miembro de la red personal
- Pedir que se evalúe la relación entre los
miembros de la red personal
22Identificar una población
- El análisis de las redes pesonales empieza de
forma muy parecida a cualquier investigación en
ciencias sociales. - La primera cosa a hacer es claramente identificar
la población de interés.
23Seleccionar una muestra de respondientes
- La recolección de datos sobre redes personales
puede ser un largo proceso de entrevista que a
veces requiere un programa informático especial. - Esto puede significar un compromiso entre la
representatividad de la muestra y el nivel de
detalles acerca de sus redes personales.
24Preguntas sobre ego
- Queremos saber algunas cosas sobre el
respondiente (ego) - Queremos saber sobre las variables dependientes
de interés. - Queremos saber también acerca de otras variables
explicativas que no están relacionadas con la
influencia social.
25Obtener miembros de la red personal
- Aquí es donde la recolección de datos de redes
personales difiere del resto de investigaciones
de ciencias sociales. - Preguntamos a ego un conjunto de cuestiones
(generadors de nombres) que permiten obtener
nombres de personas que conocen (alteri) - Lista-libre de gente con la que han obtenido
contacto en el pasado año - Gente con la que discuten temas importantes
- Gente con lo que hablaron la semana pasada
- Gente con nombres de pila específicos
- Esto define la red
26Preguntas sobre cada alter
- Preguntar a ego sobre cada alter
- Normalmente ésta es la parte más larga de la
entrevista - Si cada respondiente genera 50 alteriy se quieren
conocer 10 cosas sobre cada uno, entonces tenemos
que hacer 500 preguntas. - Se debe buscar un equilibrio entre el número de
alters y la cantidad de información que se quiere
obtener de cada uno.
27Pedir que evalúen la relación entre cada par de
alteri
- Finalmente, queremos recoger datos estructurales
para formar una matriz de adyacencia. - Esto significa que ego debe evaluar todos los
lazos posibles entre cada par de alteri. - Afortunadamente, usualmente asumimos que los
lazos son simétricos, lo cual significa que
solamente tenemos que conocer si los dos alteri
están relacionados. - El número de lazos a evaluar crece
geométricamente a medida que se añaden nuevos
alteri.
28Carga de trabajo a medida que se añaden alteri
29Cuatro posibles soluciones para reducir la carga
del respondiente
- Preguntar menos alteri
- Preguntar muchos alteri y después seleccionar una
muestra de alteri seleccionada de forma aleatoria
para establecer las relaciones entre sí. - Preguntar muchos alteri y después seleccionar un
subcojunto de relaciones - Intentar predecir un lazo a partir de la noción
de transitividad
30Conclusiones
- Para la mayor parte de medidas estructurales, un
subcojunto aleatorio de 20 alteri proporcionará
similares resultados que un listado de 45 alteri.
31What kind of data do we get?
- Data on network composition. These are summaries
of the attributes of network alters. - Data on network structure. These are summary
measures of the pattern of relations - Combinations of composition and structure
32Personal network composition
This ego has told us some things about each
alter. For example, Joydip is a 25 year old male
she met in 1994 that she is very close to.
33And we can add these to our model
Age Education Income Altage Altsmoke Duration
Number of cigarettes smoked per day
Independent variables
Dependent variable
For each respondent these now become variables
about their social environment that can be used
to predict outcome variables. In this case we
may believe that higher proportions of smoking
alters leads to smoking.
34Now we can create a set of compositional variables
- Average age of each alter (ALTAGE)
- Proportion of alters that are women (ALTWOMEN)
- Proportion of alters that are family (ALTFAMILY)
- Average length of time ego has known each alter
(DURATION) - Proportion of alters that smoke (ALTSMOKE)
35Personal Network Structure
The same Ego also evaluated the ties between
their alters. We end up with an adjacency matrix
for each ego. We can use this to calculate
structural measures.
36Now we can create a set of structural variables
- Number of components (COMP)
- Average betweenness centrality (BETWEEN)
- Closeness centralization (CLOSCENT)
- Number of alters in network core (CORESIZE)
37And these can be added to the model
Age Education Income Altage Altsmoke Duration Comp
Between Coresize
Number of cigarettes smoked per day
Dependent variable
In this model we want to test whether the
structure of the personal network impacts
smoking. For example, betweenness centrality is
a measure of bridging. Bridging represents
exposure to different groups which may not
tolerate smoking.
Independent variables
38Some measures of personal network structure
- Degree Centrality An alter is highly
degree-central to the extent he or she is
directly connected to many other alters. - Closeness Centrality An alter is highly
close-central if he or she is connected by short
paths to many other alters. - Betweenness Centrality An alter is highly
between-central to the extent he or she lies on
many geodesics (shortest paths) between alters. - Components A set of alters who are connected to
one another directly or indirectly. - Isolates A node unconnected to any other node.
- Network-Degree Centralization A measure of the
extent to which the network is dominated by a
single alter using degree centrality. - Network-Closeness Centralization A measure of
the extent to which the network is dominated by a
single alter using closeness centrality. - Network-Betweenness Centralization A measure of
the extent to which the network is dominated by a
single alter using betweenness centrality.
39How do we collect and analyze these data?
- Many researchers develop paper instruments or
computerized instruments that let them collect
these data - Compositional data are calculated using a
statistical package (e.g. SAS or SPSS) - Structural analyses are not typical and are often
limited to personal network density, since it is
an easy measure to program
40Need for personal network software
- A standardized software package would offer many
advantages - It provides a computer interface that edits and
standardized data input with complex skip
patterns - It automatically can calculate compositional and
structural measures and export them to a data set
compatible with a statistical package - It makes it possible to analyze individual cases
41EgoNetPersonal Network Analysis Software
Available at www.mdlogix.com
42Egonet design
- Egonet is written in Delphi and runs on a Windows
platform - There are two programs
- Administrator program to create a study and
assemble a questionnaire - Client program to collect data and analyze it
43Example data file from Egonet
Egonet outputs data across all the respondents
and assembles it into one file. Notice that the
data set has data about ego (sex, age),
compositional data (Proportion of females,
average alter age), and structural data
(components, cliques). This data set would be
difficult to produce without this software.
44Egonet can also visualize the personal network of
a single Ego
This is the personal network of Merced, a
19-year-old second generation West African
migrant in Spain. The dots represent her alters
and the lines represent a connection between
alters based on her evaluation of the ties.
45We can label the dots (nodes) with information we
collected from Merced about each alter, like
where they are from
46We can also size the nodes, in this case by
Merceds assessment of how close she is to each
alter
47And we can color the nodes, in this case by race
48Finally, we can shape the nodes, in this case by
whether they smoke (smokers are the squares)
49We now have a picture we can use to interview
Merced about her acculturation experience in
Spain. See the potential influence of white,
Spanish smokers in the upper right from her high
school
50Contrast this with the visualization of her 22
year old sister Laura, labeled, sized, colored
and shaped with the same variables. Their
acculturation experiences are different.
51This is Vivian, a 36 year old Moroccan woman
52And this is Jose, a 46 year old Dominican man
53We can also use Egonet to visualize structural
measures. Here is Merceds network with nodes
colored by betweenness centrality.
54Here Merceds network is colored by her relation
type (blue nodes are relatives). Egonet has done
a cluster analysis and circled nodes and labeled
them with numbers.
55Samples of first and second generation immigrants
56Procedure
- Respondents answered a set of questions about
themselves, including an acculturation scale - Respondents free-listed 45 alters given the
following definition - You know them and they know you by sight or by
name. You have had some contact with them in the
past two years, either face-to-face, by phone,
mail or e-mail, and you could still contact them
if you had to.
57Procedure (continued)
- Respondents answered twelve questions about each
alter - Respondents evaluated all 990 possible ties
between alters rating the probability that the
alters talk to each other independently of the
respondent - Structural variables were calculated using ties
that the respondent was sure existed - We conducted a qualitative interview with each
respondent using a visualization of their network
58Data Cleaning
- In some cases we questioned the authenticity of
the data - We viewed each of the 486 visualizations and
listened to the interviews. - These were scaled on a scale of 0-5 reflecting
our assessment of their authenticity
59Percent Distribution of Authenticity Scores
There are 369 cases (so far) with authenticity
of 4 or 5
60Dependent Variables
- Health 42 excellent, 42 good, 14 fair, 2
poor - Smoking - 76 smoke, 24 dont smoke
- Depression 66 not depressed, 23 mild
depression, 11 depressed - Children 51 no children, 19 one child, 13
two children
61Independent variablesRespondent characteristics
62Independent VariablesCompositional
Characteristics
63Independent VariablesStructural Characteristics
64Correlation between Dependent Variables and
Respondent Characteristics
65Correlation between Dependent Variables and
Compositional Characteristics
66Correlation between Dependent Variables and
Structural Characteristics