Vous êtes sur la page 1sur 12

ESTUDIO DE LAS PERDIDAS producto del esfuerzo que se ha

ELECTRICAS NO TECNICAS venido haciendo, aunque a un ritmo


muy por debajo del esperado. En
Beatriz García Peña términos económicos, las pérdidas no
Profesional Especializado técnicas representaban alrededor de
Oficina de Planeación US$ 150 millones, equivalentes a algo
Electrificadora de Cundinamarca S.A. más de 10% de las ventas en 1990 y
Magister en Ciencias, Estadística su recuperación representaría una
contribución significativa para la
Juan Ramos Vargas superación financiera del sector
Catedrático, Investigador y Asesor eléctrico.
Universidad Nacional de Colombia
Doctor en Estadística Aplicada Modelo Lineal General

Resumen: Las perdidas eléctricas no Es un modelo de regresión enmarcado


técnicas asociadas a la Electrificadora dentro de los mínimos cuadrados
de Cundinamarca se estudiaron ponderados.
utilizando el modelo lineal general Su construcción es apropiada cuando:
para análisis de datos categóricos y
las superficies de respuesta. Este • Las variables estudiadas son
enfoque no tiene antecedentes en el nominales, ordinales o
país ya que considera la naturaleza continuas agrupadas es decir,
categórica del fraude, y en su categóricas
desarrollo es pionero en el uso del • Las variables se diferencian en
paquete estadístico Gencat. variable factor y variables
dependientes
Esta perspectiva contribuye a asociar
• Las observaciones objeto de
dichas pérdidas a grupos cada vez
estudio son clasificadas en
más pequeños y trabajo en la
tablas de contingencia
optimización de curvas por tipo de
pérdida técnica con el objeto de El objetivo de esta metodología es
detectar en que categorías de hacer inferencia acerca de la
usuarios se requiere de un control estructura subyacente de la tabla de
prioritario. contingencia; específicamente por las
proporciones poblacionales por celda
Introducción
desconocidas (πij)
Las perdidas en el sector eléctrico
En términos generales esta
crecieron significativamente durante
metodología incluye dos pasos:
toda la década de los setenta y buena
parte de los ochenta. La declinación • La construcción de una función de
que se observó a partir del año 88 fue las proporciones observadas
objeto de investigación la cual se polinomios de primer y segundo grado
calcula por una serie de en los diferentes factores.
operaciones matriciales junto con
transformaciones logarítmicas y La superficie de respuesta es
estudiada utilizando la siguiente
exponenciales. Esta función, F,
muestra algunos aspectos de la ecuación de regresión:
relación entre la distribución de las F = Xβ + E (1)
proporciones y las variables
independientes o factores. Donde F es el vector de observaciones
• La estimación de los parámetros de la variable respuesta, X es la matriz
de un modelo y la construcción de de diseño la cual corresponde a la
pruebas estadísticas que representación codificada del espacio
involucran esa función por medio de factores, β es el vector de los
del cálculo de mínimos cuadrados coeficientes a estimar y E es el vector
ponderados. La matriz de pesos de los errores el cual se distribuye
utilizada es la inversa de normal multi-variado con parámetros θ
covarianza de F. Con este y α2I: cuando el tamaño de la muestra
procedimientos de da mayor peso es suficientemente grande.
a los elementos en F que tenga
β es estimado mediante la siguiente
varianzas más pequeñas.
expresión:
Superficies de Respuesta
β´ = (X´X)-1 X´F (2)
El objetivo de esta metodología es
bajo el supuesto que los elementos del
encontrar las condiciones óptimas de
vector respuesta, F, tiene la misma
operación para una variable respuesta
varianza. En caso contrario, es
en función de los factores que
estimado por:
intervienen en ella.
β´ = (X´VFX)-1 X´VFF (3)
Esta metodología se lleva a cabo en
dos pasos: La siguiente etapa de esta
metodología consiste en hallar los
• Construcción de la función
niveles de los factores que hacen la
respuesta
respuesta máxima. Con este fin en
• Optimización de la misma. tablas de contingencia que incluyen
La superficie de respuesta es un variables continúas agrupadas o
modelo de regresión estándar el cual ordinales se calculan e interpretan las
es lineal en los parámetros pero no primeras y segundas derivadas
necesariamente lineal en las variables parciales.
factor. Los ajustes más conocidos de
En el caso de trabajar con variables
superficies de respuesta son a nominales hallamos el máximo
matemático al ordenar las El nivel de significancia utilizado para
componentes del vector respuesta evaluar la bondad de ajuste de los
estimado y posteriormente determinar modelos fue α = 0.25 y para prueba
la correspondiente configuración del de hipótesis de los términos del
espacio de factores asociado a tales modelo α = 0,05
valores.
Este trabajo utilizo la prueba de
bondad de ajuste como una
Resultados del modelamiento de las
Perdidas eléctricas no técnicas estadística general para indicar,
primero, las variables que más
influyen en la respuesta y segundo
Se crearon modelos para el cambio
fraudulento de uso del servicio para eliminar fuentes no importantes
eléctrico para el aumento ilícito de la de variación.
carga instalada, para la alteración Las tablas de contingencia utilizadas
(ruptura o cambio) de los sellos en el para registrar los diferentes tipos de
equipo de medición y para la perdidas no técnicas fueron re-
alteración del equipo de medida. calculadas adicionando a todas las
Adicionalmente se estimaron celdas 0.5 para eliminar las
superficies de respuesta para estos dificultades por celdas con frecuencia
tipos de fraudes y se optimizaron. cero; según el criterio de Goodman.

Las causales de sanción estudiadas En primer lugar se analizo la causal


fueron: 16A o sea, el cambio del uso por parte
• Dar a la energía eléctrica un del usuario del servicio contratado o
uso distinto al declarado o convenido con la Empresa.
convenido con la entidad
Los casos sancionados por la causal
(causal 16A)
16A clasificados por distrito y carga
• Aumentar sin autorización de la
contratada se muestran en la siguiente
Entidad la carga o capacidad
tabla de contingencia.
instalada por encima de la
contratada (causal 16D)
• Retirar, romper o adulterar uno
cualquiera de los sellos
instalados en los equipos de
medición, protección, control o
gabinete (causal 16F)
• Adulterar las conexiones o
aparatos de medición o de
control (causal 16E)
Tabla1: Causal 16A por distrito y El problema inicialmente planteado
carga contratada fue analizar la probabilidad del cambio
fraudulento de residencial a comercial
Cambio de
Distrito Carga Residencial a dala la combinación de las variables
Contratada Comercial Industrial
CC>=5 4 3 independientes.
Fusagasugá CC<5 5 0
CC>=5 1 0 Se investigo el efecto del Distrito, de la
Girardot CC<5 4 1
CC>=5 2 2 carga contratada y medio en la
La Mesa CC<5 12 0
CC>=5 1 1
respuesta estudiada (cambio ilícito de
Villeta CC<5 8 1 uso residencial a comercial).
CC>=5 0 0
Cáqueza CC<5 7 1
CC>=5 1 1 Por lo tanto los parámetros a estimar
Choachí CC<5 1 0
fueron:
Fuente: Resoluciones Ejecutivas

El cambio de uso con los siguientes β0: Efecto medio


perfiles: residencial-comercial y β1: Efecto diferencial para el distrito de
residencial-industrial, constituye la Fusagasugá
variable dependiente; el distrito donde
se localiza el usuario fraudulento y la β2: Efecto diferencial para el distrito de
carga contratada (CC) agrupada en Girardot
las siguientes categorías CC>=5
β3: Efecto diferencial para el distrito de
Kilovatios y CC<5 Kilovatios
La Mesa
conforman las variables
independientes. β4: Efecto diferencial para el distrito de
Villeta
El distrito, la ubicación geográfica del
usuario fraudulento constituye una β5: Efecto diferencial para el distrito de
variable nominal. Cáqueza
La carga contratada en kilovatios es β6: Efecto diferencial para la CC>=5
una variable continua agrupada y
exhaustiva. Esta se agrupo así a El efecto medio es la probabilidad de
criterio del investigador porque 5 cambio fraudulento, residencial-
kilovatios es la carga media comercial sin considerar el distrito y la
contratada por el usuario típico en el carga instalada.
sector residencial y este es el punto
Se simularon los siguientes modelos
de partida de los cambios registrados.
lineales generales para estudiar la
Estas tres variables producen una frecuencia de cambio fraudulento
tabla de tres dimensiones con una residencial-comercial:
respuesta y dos factores.
• Modelo lineal de efectos
principales
• Modelo logarítmico de efectos
principales
Cuyo máximo y mínimo corresponden
• Modelo lineal de efectos
a -0.002 y 0.129 respectivamente.
principales y de segundo orden
Asociado al máximo están los distritos
• Modelo logarítmico de efectos
y la carga contratada menor a 5
principales y de segundo orden
kilovatios y al mínimo los distritos y la
Se concluyo: carga contratada mayor o igual a 5
kilovatios.
1. El factor principal que explica el
cambio fraudulento de uso Con el objeto de estudiar la razón
residencial a comercial es la logarítmica de cambio residencial-
carga contratada menor a 5 comercial y residencial-industrial,
kilovatios elaboramos un modelo Logit el cual
Asociado a usuarios que fue no significativo al nivel establecido
cambian de uso y tiene una y cuya interpretación es que la razón
carga contratada menor de 5 de las frecuencias analizadas se
kilovatios existe una explica fundamentalmente por la
probabilidad del 24% de que carga contratada. Es decir, la
cambien fraudulentamente de diferencia entre el LN(residencial a
residencial a comercial. comercial) y LN(residencial a
2. El cambio ilícito de uso, industrial) está asociada a la carga
residencial a comercial, no está contratada menor de 5 kilovatios con
asociado a los distritos. una probabilidad del 77.3%.
3. El distrito no tiene un efecto
La función de respuesta encontrada
cuadrático en la respuesta al
para el modelo Logit de efectos
cambio.
principales no significativos tiene la
4. 32% es la probabilidad
siguiente forma:
estimada de cambio
fraudulento residencial-
comercial sin considerar la
ubicación y la carga contratada LN (R a C/R a I) = b0 + b1X1i + e (6)
5. La función de respuesta
encontrada para el mejor Estimando los b´s obtenemos:
modelo de efectos principales
tiene la siguiente forma: LN (R a C/R a I) = 1.042 – 0.817X1i +
e (7)
Y = b0 + b1X1i + e (4)
Estimando los b´s obtenemos: Cuyo máximo y mínimo corresponden
a 1.86 y 0.22 respectivamente.
Y = -0.065 – 0.063X1i + e (5) Asociado al máximo están los
usuarios ubicados en los diferentes Tabla 2: Resumen de las principales
distritos y cuya carga contratada es estadísticas
menor a 5 kilovatios y al mínimo los
Modelo Hipótesis X2 GL
usuarios ubicados en los diferentes Propuesto Planeada
distritos y con carga contratada mayor
Efectos F=Xβ 1.140 5
a 5 kilovatios. Principales β1=0
LN(Residencial- Efecto
Comercial) Fusagasugá
Las conclusiones anteriores se β2=0
pueden constatar interpretando la Efecto
Girardot 1.946 5
tabla 2. β3=0
Efecto La
Mesa
β4=0
Efecto
Villeta
β5=0
Efecto
Cáqueza
β6=0
Efecto 4.470* 1
CC>=5
Modelo F=Xβ 3.090 10
Reducido β1=0
LN(Residencial- Efecto 6.220* 1
Comercial) CC>=5
Efectos F=Xβ
Principales β1=0
LN (Residencial Efecto
a Comercial/ Fusagasugá
Residencial a β2=0
Industrial) Efecto 5
Girardot
β3=0
Efecto La
Mesa
β4=0
Efecto
Villeta
β5=0
Efecto
Cáqueza
β6=0 1
Efecto
CC>=5
Modelo
Reducido F=Xβ 2.308 10
LN (Residencial β1=0 6.153* 1
a Comercial/ Efecto
Residencial a CC>=5
Industrial)
Fuente: Listado resultados arrojados
Gencat

Adicionalmente se estudio la
frecuencia de cambio residencial a
comercial en función del distrito y la Tabla 4: Causal 16D por distrito y
carga instalada encontrada en el modalidad de servicio
momento de la inspección
Distrito Modalidad Carga
de Servicio Fraudulenta
Tabla3: Causal 16A por distrito y CF<5 CF>=5
carga encontrada Villeta Comercial 50 9
Industrial 1 3
Cambio de Residencial Hotelero 1 6
Distrito Carga a Pacho Comercial 0 1
Contratada Comercial Industrial Industrial 1 3
CE>=5 3 3 Hotelero 0 0
Fusagasugá CE<5 5 0 La Mesa Comercial 7 6
CE>=5 0 1 Industrial 0 2
Girardot CE<5 1 0
Hotelero 0 0
CE>=5 6 1
La Mesa CE<5 2 0
Girardot Comercial 14 16
CE>=5 6 1 Industrial 1 3
Villeta CE<5 0 0 Hotelero 0 1
CE>=5 6 1 Fusagasugá Comercial 6 3
Cáqueza CE<5 5 0 Industrial 1 2
CE>=5 3 0 Hotelero 0 0
Choachí CE<5 4 1 Choachí Comercial 1 0
Fuente: Resoluciones Ejecutivas Industrial 0 2
Hotelero 0 0
Los múltiples modelos creados para Cáqueza Comercial 7 1
Industrial 1 0
estudiar la respuesta al cambio Hotelero 0 0
residencial-comercial en función del Fuente: Resoluciones ejecutivas
distrito y la carga encontrada en el
La carga fraudulenta obtenida por la
momento de la inspección se
diferencia entre la carga contratada y
rechazaron. Esto indica que no hay
la encontrada en el momento de la
asociación ente el cambio ilícito de
inspección constituye la variable
residencial a comercial y la carga
dependiente; el distrito donde se
instalada real.
localiza el usuario fraudulento y la
En segundo lugar se analizó la causal modalidad de uso – comercial
16D, aumentar la carga instalada por industrial y hotelero- conforman las
encima de la contratada. variables independientes.

Los casos sancionados por esta La carga fraudulenta, CF, en kilovatios


causal se clasificaron por distrito y es una variable continúa agrupada en
modalidad de servicio se muestran en las siguientes categorías CF<5 y
la siguiente tabla de contingencia. CF>=5, exhaustivas,

El distrito es una variable nominal


cuyas categorías corresponden a
Villeta, Pacho, La Mesa, Girardot,
Fusagasugá, Choachí y Cáqueza.
La variable modalidad de uso es una β6: Efecto diferencial para el uso
variable categórica con tres valores comercial
posibles; comercial, industrial y
hotelero. Se diferencio el servicio β7: Efecto diferencial para el uso
industrial
industrial del hotelero porque
implícitamente la industria y la El efecto medio es la probabilidad de
hotelería son actividades económicas aumentar fraudulentamente la carga
diferentes y por lo tanto se espera instalada en más de 5 kilovatios sin
diferente comportamiento fraudulento. considerar el distrito y la modalidad de
Estas tres variables producen una servicio.
tabla de tres dimensiones con una Constructivamente generamos los
respuesta y dos factores. siguientes modelos, para estudiar la
El problema es analizar la probabilidad frecuencia de CF>=5:
de aumentar sin autorización en más • Modelo lineal de efectos
de 5 kilovatios la carga instalada bajo principales
la combinación de las categorías de • Modelo logarítmico de efectos
las variables independientes. principales
Se investigo el efecto del distrito, • Modelo lineal de efectos
modalidad de uso dado al servicio de principales y de segundo orden
electricidad y medio en la respuesta • Modelo logarítmico de efectos
objeto de estudio, CF>= 5 kilovatios. principales y de segundo orden

Por lo tanto los parámetros a estimar Se concluyó


fueron:
1. Los factores principales que
β0: Efecto medio
explican la frecuencia de carga
β1: Efecto diferencial para el distrito de fraudulenta igual o superior a 5
Villeta kilovatios son el distrito y la
modalidad de servicio.
β2: Efecto diferencial para el distrito de Asociado a los distritos de
Pacho Girardot, La Mesa, Pacho y
β3: Efecto diferencial para el distrito de Choachí se tiene una probabilidad
La Mesa del 15%, 11%, 9% y 3%
respectivamente de que un usuario
β4: Efecto diferencial para el distrito de aumente ilícitamente en 5
Girardot kilovatios o más la carga instalada
y contratada.
β5: Efecto diferencial para el distrito de
Asociamos al sector industrial y
Fusagasugá
hotelero una probabilidad del 7% y
del 20% de incurrir en el fraude de Lij = αj + βjXj (10)
aumentar la carga instalada en por
los menos 5 kilovatios. Para j= 1,2
2. El distrito y la modalidad de uso no i= 1,….r, donde r representa el
interactúan generando una número asignado al último distrito de
variación en la respuesta objeto de la tabla objeto de estudio.
estudio
3. Las variables independientes no Lij es la j-ésima logit para el i-ésimo
tienen un efecto cuadrático en la distrito, α1 y β1 son el intercepto y
respuesta. pendiente para la línea de la causal
4. Para la causal 16D construimos 16A (16F) y α2 y β2 son el intercepto y
una superficie de respuesta de pendiente para la línea de la causal
primer orden la cual se puede 16D (16E).
expresar así:
Cuando se analiza la causal 16A y
CF>=5 =
causal 16D los parámetros a estimar
bo+b1x1i+b2x2i+b3x3i+b4x4i+b5x5i+b6
fueron:
x6i+b7x7i+b8x8i+e (8)
Estimando los b´s tenemos: α1: intercepto causal 16A
CF>=5 =
0.542+0.015x1i+0.108x2i+0.057x3i+ α2: intercepto causal 16D
0.119x4i-0.050x5i-0.013x6i-
β1: pendiente causal 16A
0.160x7i+0.121x8i+e (9)
Esta función tiene el máximo en β2: pendiente causal 16D
Girardot-Sector Industrial, 0782; y
el mínimo en Choachí –sector La estimación de los parámetros y sus
comercial, 0.145. errores estándar son:

α1 =-0.392 +-0.458
Adicionalmente se realizó un análisis
Logit multi-variado, en el cual líneas α2= 0.402 +-0.428
Logit fueron ajustadas en pares para
β1= -0.043+-0.079
la causal 16A –causal 16D y para la
causal 16E y causal 16F. β2= -0.095+-0.070

El objetivo fue calcular dos líneas una Para la prueba de igualdad de rata de
para cada una de las causales crecimiento de la causal 16A y 16D en
analizadas simultáneamente que un distrito dado obtuvimos la siguiente
relaciones la función Logit de tales X2 = 0.311 con un grado de libertad.
causales por distrito. Estadísticamente esto significa que
las ratas de crecimiento para la causal
El modelo utilizado fue: 16A y 16D con respecto al distrito son
iguales.
Cuando se analiza la causal 16F y Tabla 6: Causal 16F y 16E por Distrito
causal 16E los parámetros a estimar
Causal 16F
fueron: Distrito SI NO
Causal 16E Causal 16E
α1: intercepto causal 16F SI NO SI NO
Pacho 0 0 1 10
Choachí 1 0 2 8
α2: intercepto causal 16E Cáqueza 0 1 1 12
La Mesa 0 0 9 36
β1: pendiente causal 16F Fusagasugá 0 0 7 55
Facatativá 0 0 1 11
β2: pendiente causal 16E Girardot 3 6 22 14
Fuente: Resoluciones Ejecutivas

La estimación de los parámetros y sus


Conclusión
errores estándar son:
El programa de detección de pérdidas
α1 =-0.158 +-0.665
no técnicas en la Electrificadora de
α2= -2.480 +-0.488 Cundinamarca debe priorizar la
inspección del sector industrial de
β1= 0.247+-0.117 Girardot y la inspección del sector
hotelero e industrial de los distritos de
β2= 0.334+-0.092
la Mesa, Pacho y Choachí. Este plan
Para la prueba de igualdad de rata de optimizara la detección de usuarios
crecimiento de la causal 16F y 16E en que aumenta de forma fraudulenta la
un distrito dado obtuvimos la siguiente carga contratada.
X2 = 0.376 con un grado de libertad.
Recomendaciones
Estadísticamente esto significa que
las ratas de crecimiento para la causal 1. Recomendamos asumir una
16F y 16E con respecto al distrito son estrategia estadística no solo
iguales. en la etapa de evaluación de la
información sobre perdidas no
Tabla 5: Causal 16A y 16D por Distrito
técnicas sino en la
Causal 16A determinación de los usuarios a
Distrito SI NO
Causal 16D Causal 16D
revisar y en el tipo de
SI NO SI NO información a recolectar.
Pacho 1 0 6 4
2. Una vez determinados los
Choachí 2 4 1 4
Gachetá 0 0 0 26 costos y beneficios del
Cáqueza 8 0 4 3 programa de perdidas no
Villeta 10 2 60 3
La Mesa 12 13 5 15 técnicas se puede aplicar
Fusagasugá 9 3 4 46 dichos valores a los modelos
Facatativá 1 0 5 6
Girardot 8 1 35 55 propuestos con el fin de
Fuente: Resoluciones Ejecutivas minimizar y maximizar la
función de costos y beneficios
por tipo de fraude. Con esto (4) COCHRAN WILLIAM, COX
obtendríamos la combinación GERTRUDE, Diseños
satisfactoria de costos y Experimentales, Editorial
beneficios por tipo de pérdida Trillas, México, 1971
no técnica. (5) FORTHOFER RONALD,
3. Los modelos propuestos se LEHNEN ROBERT, Public
pueden utilizar para estimar los Program Analysis, Lifetime
usuarios fraudulentos por learning Publications,
causal partiendo de la California, 1981
clasificación de toso los (6) FORTHOFER RONALD, An
usuarios de la empresa en los Analysis for Compounded
factores analizados (distritos y for Categorical Data,
carga contratada, distritos y Biometrics, March 1973
carga encontrada, distritos y (7) FORTHOFER RONALD N,
tipo de servicio) utilizando las KOCH GARY, An Analysis
frecuencias estimadas por for Compounded Functions
medio de la metodología de of Categorical Data,
G.S.K. Biometrics, March, 1973
4. Contando con la información (8) GRIZZLE JAMES,
pertinente y utilizando el Multivariate Logit Analysis,
modelo lineal general se podría Biometrics, 1971
establecer la asociación del (9) GRIZZLE J., STARMER F.,
fraude con la tarifa, el tipo de Y KOCH G., Analysis of
actividad industrial, el tipo de Categorical Data by Lineal
comercio y las marcas de los Models, Biometrics,
equipos de medición. September 1969
(10) JOHSON WILLIAM Y
Bibliografía KOCH GARY, A Note on the
Weighted Least Squares
(1) AGRESTI ALAN, Analysis Analysis of the Contingency
of Ordinal Categorical Data. Table Data, tecnometrics,
John Wiley & Sons, 1984 March 1971
(2) BELZ MAURICE, Statistical (11) LANDIS RICHARD Y
Methods in The process OTHERS, A Computer
Industries, Lowe & Brydone Program for the Generalizad
Ltda, 1973 Chi-square Analysis of
(3) BISHOP, FIENBERG, Categorical Data Using
HOLLAND, Discrete Weighted Least Squares,
Multivariate Analysis: North Holland Publishing
Theory and Practice, MIT Company
Press, Sixtih Printing, 1980
(12) MOD ALEXANDER,
GRAYBILL FRANKLIN,
BOES DUANE, Introduction
to the Theory of Statistics,
McGreaw Hill, Third Edition

Investigación presentada en la IX
Jornadas Nacionales de Energía,
Bogotá, Paginas 126-131

Vous aimerez peut-être aussi