Automated Hardhat Detection For Construction Safety Applications

Big Data en la industria de la construcción:
una revisión del estado actual , las

oportunidades y las tendencias futuras
Resumen: la capacidad de procesar grandes cantidades de datos y extraer información útil de los datos ha
revolucionado la sociedad. Este fenómeno, denominado Big Data, tiene aplicaciones para amplia variedad de industrias,
incluida la industria de la construcción. La industria de la construcción ya se ocupa de grandes volúmenes de datos
heterogéneos; que se espera que aumente exponencialmente a medida que tecnologías tales como redes de sensores
e Internet de Las cosas son comoditized. En este documento, presentamos un detallado encuesta de la literatura ,
investigando la aplicación de Big Data técnicas en la industria de la construcción. Revisamos relacionados trabajos
publicados en las bases de datos de la Asociación Americana de Ingenieros Civiles (ASCE), Instituto de Electricidad y
Electrónica Ingenieros (IEEE), Asociación de Maquinaria de Computación (ACM), y Elsevier Science Direct Digital
Library. Mientras la aplicación de análisis de datos en la industria de la construcción no es nuevo, el adopción de
tecnologías Big Data en esta industria se mantiene en una etapa incipiente y retrasa el amplio uso de estas tecnologías
enotros campos. Hasta donde tenemos conocimiento, actualmente no existe estudio exhaustivo de las técnicas de Big
Data en el contexto de la industria de la construcción . Este documento llena el vacío y presenta un una amplia
revisión interdisciplinaria de la literatura de campos tales como estadísticas, minería de datos y almacenamiento,
aprendizaje automático y Big Data Analytics en el contexto de la industria de la construcción. Discutimos el estado
actual de adopción de Big Data en el industria de la construcción y discutir el potencial futuro de tales tecnologías en
las múltiples subáreas específicas de dominio de la industria de construccion. También proponemos problemas y
direcciones abiertos para el trabajo futuro junto con las posibles dificultades asociadas con BigAdopción de datos en la
industria.
I. I NTRODUCCIÓN
Actualmente, el mundo está inundado de datos, con una tecnología de rápido avance que conduce a un
aumento constante. Hoy, las empresas tratar con petabytes (10 15 bytes) de datos. Procesos de Google por
encima de 24 petabytes de datos por día [1], mientras Facebook obtiene más de 10 millones de fotos por
hora [1]. El exceso de datosaumentado en 2012 es de aproximadamente 2,5 quintillones (10 18 ) bytes por
día [2]. Este crecimiento de datos brinda oportunidades significativas a los científicos para identificar
conocimientos y conocimientos útiles. Podría decirse que el acceso a los datos puede mejorar el estado quo
en varios campos mediante el fortalecimiento de las estadísticas existentes y métodos algorítmicos [3], o
incluso haciéndolos redundantes [4].
La industria de la construcción no es una excepción a la revolución digital generalizada. La industria está
tratando con datos significativos que surgen de diversas disciplinas en todo el ciclo de vida de una
instalación. Modelado de información de construcción (BIM) está previsto para capturar información CAD
multidimensional sistemáticamente para apoyar la colaboración multidisciplinaria entre los interesados
[5]. Los datos BIM suelen ser codificados geométricamente en 3D, intensivos en cómputo (gráficos y
computación booleana), comprimidos, en diversos formatos propietarios, y
entrelazado [6]. En consecuencia, esta información diversa se recopila en modelos BIM federados, que se
enriquecen gradualmente y persisten más allá del final de la vida útil de las instalaciones. Los archivos BIM
pueden volverse voluminosos rápidamente, con los datos de diseño de un modelo de construcción de 3
pisos que alcanzan fácilmente 50 GB de tamaño [7]. Notablemente, estos datos en cualquier forma y forma
tienen un valor intrínseco para el rendimiento de la industria . Con la llegada de los dispositivos y sensores
integrados, las instalaciones incluso han comenzado a generar datos masivos durante las operaciones y la
etapa de mantenimiento,
finalmente conduce a fuentes más ricas de Big BIM Data. Esta gran acumulación de datos BIM ha empujado
a la industria de la construcción a entrar en la era de Big Data.
Big Data tiene tres atributos definitorios (también conocidos como 3 V ), a saber (i) volumen (terabytes,
petabytes de datos y más); (ii) variedad (formatos heterogéneos como texto, sensores, audio, video,
gráficos y más); y (iii) velocidad (flujos continuos de los datos). Los 3 V de Big Data son claramente
evidentes en los datos de construcción. Los datos de construcción suelen ser grandes, heterogéneos y
dinámicos [8]. Los datos de construcción son voluminosos debido a los grandes volúmenes de datos de
diseño, cronogramas, sistemas de planificación de recursos empresariales (ERP), datos financieros, etc. La
diversidad de los datos de construcción se puede observar al observar los diversos formatos admitidos en
aplicaciones de construcción, incluido DWG (abreviatura de dibujo ), DXF (formato de intercambio de
dibujos), DGN (abreviatura de diseño), RVT (abreviatura de Revit), ifcXML (Industry Foundation Classes XML),
ifcOWL (Industry Foundation Classes OWL), DOC / XLS / PPT (formato de Microsoft), RM / MPG (formato de
video) y JPEG (formato de imagen). La naturaleza dinámica de los datos de construcción se deriva de la
naturaleza de transmisión de las fuentes de datos, como Sensores, RFID y BMS (Building Management
System). Utilizando estos datos para optimizar las operaciones de construcción es el 82
próxima frontera de la innovación en la industria.

[Higo. 1 acerca de aquí.]
Para comprender las sutilezas de Big Data, debemos eliminar la ambigüedad entre dos de sus aspectos
complementarios: Big Data Engineering (BDE) y Big Data Analytics (BDA). El dominio de BDE se refiere
principalmente a apoyar las actividades de procesamiento y almacenamiento de datos relevantes,
necesarios para el análisis [9]. BDE abarca pilas de tecnología como Hadoop y Berkeley Data Analytics Stack
(BDAS). Big Data Analytics (BDA), el segundo aspecto integral, se relaciona con las tareas responsables de
extraer el conocimiento para impulsar la toma de decisiones [9]. BDA se preocupa principalmente por los
principios, procesos y técnicas para comprender Big Data. La esencia de BDA es descubrir los patrones
latentes enterrados dentro de Big Data y derivar ideas útiles de allí [10]. Estas ideas tienen la capacidad de
transformar el futuro de muchas industrias a través de la toma de decisiones basadas en
datos. Esta capacidad de identificar , comprender y reaccionar ante lo latente las
tendencias rápidamente son de hecho una ventaja competitiva en esta era hipercompetitiva.
Contribuciones de este trabajo: Si bien se han propuesto algunas soluciones basadas en datos para los
campos de la construcción la industria, actualmente no existe un estudio exhaustivo de la literatura ,
dirigida a la aplicación de Big Data en el contexto de la industria de la construcción . Este documento llena
el vacío y presenta un amplio estudiointerdisciplinario de campos tales como Estadística, Minería de datos
y almacenamiento, Aprendizaje automático, Big Data y sus aplicaciones en la industria de la construcción.
Organización de este documento: la discusión en este documento seguir la estructura de revisión se
muestra en la Fig. 1. Empezamos con una revisión exhaustiva de la literatura existente sobre BDE y BDA en
el industria de la construcción en la Sección II y III, respectivamente. Después que, oportunidades de Big
Data en la industria de la construcción los subdominios se presentan en la Sección IV. Discusiones
sobre cuestiones abiertas de investigación y trabajo futuro, y trampas de Big Data en la industria de la
construcción se presentan a continuación en la Sección V y VI, respectivamente.
II. B IG D ATA E NGINEERING (BDE)
Big Data Engineering (BDE) proporciona infraestructura para admitir Big Data Analytics (BDA). Algunas
discusiones sobre el Plataformas de Big Data que vale la pena considerar para entender el BDE de
manera adecuada. Varias plataformas Big Data se desarrollan hasta el momento con características
variadas, que se pueden dividir en dos grupos: (i) plataformas de escala horizontal (HSP) , las que distribuir
el procesamiento a través de múltiples servidores y escalar por la adición de nuevas máquinas a
la agrupación. (ii) Y escalamiento vertical plataformas (VSP) , en las que la escala se logra mediante la
actualización hardware ( procesador o memoria o disco ) del subyacente servidor ya que es una
configuración única basada en servidor. En el interés de la brevedad de este documento, la discusión aquí
está confinada a HSP, especialmente Hadoop y BDAS solamente . Nos referimos interesados lectores de
Singh et al. [11] para una explicación detallada de su
criterio de comparación y selección.
Debido a las claras ganancias de rendimiento de BDAS sobre Hadoop, está recibiendo más atención
recientemente. Sin embargo, BDAS está en su infancia con apoyo limitado y herramientas de
apoyo. Mientras, Hadoop sigue siendo ampliamente adoptado y se ha convertido en el marco de hecho
para las aplicaciones de Big Data. Estas plataformasofrecen herramientas para almacenar y procesar Big
Data. Algunos de los más herramientas prominentes se discuten en las secciones siguientes.
A. Procesamiento de Big Data

El cómputo paralelo y distribuido es el núcleo del BDE. Se desarrolla una gran cantidad de modelos de
procesamiento para este propósito, que incluye pero no se limita a:
1 ) MapReduce (MR ) : MR es el procesamiento distribuido modelo para manejar Big Data [13]. Toda la
tarea analítica en MR se escriben como dos funciones, es decir, mapear y reducir (ver Fig. 2), que se envían
a procesos separados llamados Mapeadores y Reductores. Mapper lee los datos, los procesa y genera
resultados intermedios. Los reductores trabajan en la salida de los cartógrafos y producen resultados finales
que se almacenan de nuevo en el sistema de archivos. Hadoop, una plataforma popular de Big Data,
introdujo MR inicialmente para el público en general y proporcionó un ecosistema para ejecutar con éxito
los programas de MR . En un clúster Hadoop típico , varios mapeadores y
reductores ejecutan simultáneamente programas MR. MR es un poderoso modelo para tareas de
procesamiento por lotes. Sin embargo, está luchando con aplicaciones que requieren procesamiento en
tiempo real, gráfico o iterativo. Las últimas versiones de Hadoop han encontrado este problema hasta
cierto punto, donde el aspecto de procesamiento de MR se separa del resto del ecosistema. Con este fin, se
presenta Yet Another Resource Negotiator (YARN) que ha llevado a Hadoop a una plataforma de Big
Data realmente agnóstica desde el punto de vista computacional. MR se ejecuta como un servicio sobre
YARN, mientras que YARN maneja las funcionalidades relacionadas con la programación y la gestión de
recursos. Esta separación ha hecho que Hadoop sea adecuado para
implementando aplicaciones innovadoras.
2) Gráficos acíclicos dirigidos (DAG) : DAG es un modelo de procesamiento alternativo para plataformas Big
Data. A diferencia de MR, DAG relaja el estilo rígido de mapa de MR para una noción más genérica. BDAS,
una plataforma emergente de Big Data, admite este tipo de procesamiento de datos a través de su
componente resistente llamado Spark [14]. Spark tiene supremacía sobre MR en muchos
aspectos. Particularmente, el cálculo en memoria y la alta expresividad son claves para una adopción más
amplia de Spark. Estas capacidades anunciaron que Spark es una elección natural para soportar aplicaciones
iterativas y reactivas [14]. Se informa que Spark es diez veces más rápido que MR en tareas residentes en
disco, mientras que cien veces más rápido para tareas residentes en memoria [11]. La Fig. 3 muestra los
componentes de Spark. Estas tecnologías están diseñadas para soportar funciones que son vitales para el
desarrollo de aplicaciones empresariales.
Ejemplos de investigación de construcción que utiliza procesamiento de Big Data: MR y Spark tienen casos
de uso en una miríada de sistemas de información (IS) de la industria de la construcción. A pesar de la
importancia, estas herramientas rara vez se utilizan para procesar datos BIM en aplicaciones de la industria
de la construcción.
Chang et al. [16] MR personalizada para datos BIM (MR4B) para optimizar la recuperación de modelos BIM
parciales. Consideraron que la lógica de distribución de datos heredada de Hadoop MR era inadecuada, ya
que los datos BIM están entrelazados y muy relativos, y simplemente colocarlos aleatoriamente podría
distribuir escasamente elementos BIM a través de diferentes bloques en los nodos del clúster Hadoop . Tal
colocación degrada el rendimiento de las consultas debido a la mayor necesidad de E / S del disco para
reunir los datos escasamente distribuidos para el análisis utilizando MR. Para superar esto, se diseña una
prepartición de datos y un paso de procesamiento para analizar, analizar y particionar partes lógicamente
relevantes de los datos BIM (por número de planta o familia de materiales) y almacenarlos en los espacios
adyacentes en el clúster de Hadoop . Se introduce el multithreading de nodos para utilizar la CPU al
máximo durante el análisis [16]. De esta forma, Hadoop se personaliza para datos BIM y los componentes
de consulta se implementan como aplicaciones YARN. Se desarrolla un sistema BIM para detección de
choques y estimación de cantidad para explotar las aplicaciones de YARN propuestas. Se informa que el
sistema ha mejorado el colector de rendimiento, y las tareas requeridas son ejecutado en tiempo real con
un tiempo de respuesta razonable.
Lin et al. [7] presentó el desarrollo de un gran especialista Sistema de almacenamiento y recuperación de
datos BIM para expertos e ingenuos Usuarios BIM. Las intenciones son desarrollar un sistema altamente
interactivo interfaz de usuario para consultar datos BIM a través de dispositivos móviles para maximizar su
utilidad y usabilidad. Consultas de usuario en plano Inglés son reformulados utilizando el lenguaje natural
propuesto enfoque de procesamiento para recuperar datos BIM altamente complejos,
que están mapeados en una variedad de visualizaciones. Para optimizar ejecución de consulta, se
demuestra un preprocesamiento de unión MR fusionar dos colecciones BIM antes de la evaluación de la
consulta. los se informa que el tiempo de respuesta se ha mejorado en más del 40% en comparación con el
mismo preprocesamiento de unión escrito en tradicional tecnologías.
B. Big Data Storage

Otro aspecto de BDE es el almacenamiento Big Data, que es proporcionado por los sistemas de archivos
distribuidos o emergentes Bases de datos NoSQL. Estas tecnologías se discuten brevemente en las
siguientes subsecciones.
1) Sistemas de archivos distribuidos : en esta subsección, estamos discutiendo dos sistemas de archivos
distribuidos que compiten, a saber HDFS y Tachyon.
-Hadoop Distributed File System (HDFS) -HDFS es diseñado adecuadamente para gestionar los
conjuntos de datos más grandes [17]. Está diseñado específicamente para trabajar con un conjunto de
servidores básicos. Dado que las posibilidades de falla de hardware son más alto en tales configuraciones,
proporciona una mayor tolerancia a fallas por fallas de hardware. Distribución de datos y replicaciones son
los rasgos clave de HDFS para lograr la tolerancia a fallas y alta disponibilidad. Sin embargo, hay situaciones
cuando el uso de HDFS degrada el rendimiento, particularmente en aplicaciones que requieren acceso a
datos de baja latencia Similar, tampoco es ideal para almacenaruna gran cantidad de
pequeños archivos debido a la sobrecarga asociada para la gestión de su metadata Por último, HDFS no es
la elección de la tecnología
si las aplicaciones requieren un número significativo de concurrentes modificaciones en lugares aleatorios
en los datos.
-Tachyon es el sistema de archivos distribuido insignia de BDAS que extiende HDFS y proporciona
acceso al distribuido datos a velocidad de memoria en el clúster . Algunos de los Las funciones en las que
Tachyon se ha burlado de HDFS incluyen: (i) almacenamiento en memoria caché de datos en memoria para
un mejor rendimiento y (ii)compatibilidad con versiones anteriores para trabajar sin problemas con Spark
así como tareas de MR sin ningún código cambios requeridos a los programas.
2) Bases de datos NoSQL : las bases de datos relacionales sirvieron a la industria de TI durante las últimas
décadas como estándar de gestión de datos de facto. Sin embargo, recientemente surgieron
aplicaciones que exigía más escalabilidad, rendimiento y flexibilidad. Las bases de datos relacionales no son
adecuadas para estas aplicaciones debido a sus necesidades especializadas de almacenamiento y
procesamiento. En consecuencia, se crearon nuevos sistemas, llamados "No solo SQL". (NoSQL) sistemas
para llenar esta brecha tecnológica. Los sistemas NoSQL mejoraron la gestión de datos tradicional de
muchas maneras. Más importante aún, los sistemas NoSQL evitan el almacenamiento rígido orientado al
esquema a favor del almacenamiento sin esquema para lograr flexibilidad [18]. Hoy en día, estos sistemas
prevalecen en innumerables aplicaciones de uso intensivo de datos en muchas industrias. Acentuadamente,
la arquitectura de los sistemas NoSQL se adapta bien a la naturaleza fragmentada de los datos de la
industria de la construcción.
Los sistemas NoSQL almacenan datos sin esquema en un modelo de datos no relacional. Presumiblemente,
hay cuatro modelos de datos para estos sistemas.
1) Valor clave: este es el modelo de datos más simple para almacenar datos no estructurados. Sin embargo,
los datos subyacentes no son
autodescriptivo
2) Documento: este modelo de datos es adecuado para almacenar entidades autodescriptivas. Sin
embargo, el almacenamiento de este modelo puede ser ineficiente.
3) Columnar: este modelo de datos favorece el almacenamiento de conjuntos de datos dispersos,
subcolumnas agrupadas y columnas agregadas.
4) Gráfico: este es un modelo de datos relativamente nuevo que admite el cruce de relaciones en un
enorme conjunto de datos de gráficos de propiedades. Las bases de datos de gráficos son cada vez más
populares que otros modelos de datos (vea la Fig. 4, donde el eje x representa el período de popularidad y
el eje y muestra un cambio en la popularidad). La Tabla VIII describe características de 12 bases de datos
prominentes.
[TABLA 1 acerca de aquí.]
Ejemplos de investigación de construcción que utilizan Big Data Storage: a pesar de la importancia del
almacenamiento masivo de datos BIM, las aplicaciones existentes aún carecen de su implementación
exitosa. Das et al. [20] propuso Social-BIM para capturar las interacciones sociales de los usuarios junto con
los modelos de construcción. Un marco BIM distribuido, llamado BIMCloud, está desarrollado para
almacenar estos datos a través de IFC. Apache Cassandra, alojado en Amazon EC2, se utiliza. Jeong et
al. [21] propuso una infraestructura de gestión de datos híbrida compuesta por dos niveles. El nivel del
cliente que utiliza MongoDB para almacenar temporalmente los datos estructurados para completar las
tareas analíticas de manera eficiente, mientras que el nivel central emplea a Apache Cassandra para
almacenar permanentemente los flujos de datos del sensor generados a lo largo del tiempo. Cheng et
al. [22] también han empleado Apache Cassandra para
presentando su lenguaje de consulta para extraer modelos BIM parciales. Del mismo modo, Lin et al. [7]
explotó MongoDB para almacenar datos BIM de construir modelos para el procesamiento distribuido a
través de MapReduce. MongoDB está diseñado para IFC, con pequeñas alteraciones en la jerarquía de IFC
para soportar la ejecución de consultas de MR eficiente.
III. B IG D ATA A NALYTICS

Big Data Analytics tiene una rica tradición intelectual y toma prestadas de una amplia variedad de
campos. Ha habido
Tradicionalmente, muchas disciplinas relacionadas que tienen esencialmente el mismo enfoque central:
encontrar patrones útiles en los datos (pero con un énfasis diferente). Estos campos relacionados son
Estadísticas (1830 1 )
1 Aunque puede ser difícil precisar el momento exacto de la génesis de la tecnología, el año en el que se propuso el trabajo seminal del
dominio es
proporcionado para secuenciar aproximadamente los diversos análisis Big Data Analytics
tecnologías cronológicamente.
[23], Data Mining (1980), Predictive Analytics (1989 [24]), Business Analytics (1997), descubrimiento del
conocimiento de los datos (KDD) (2002), Data Analytics (2010), Data Science (2010) y ahora Big Data
(2012). La Fig. 5 muestra la relevancia de estos campos multidisciplinarios para Big Data. Entonces, Big Data
Analytics es una ampliación del campo de análisis de datos e incorpora muchas de las técnicas que ya se han
realizado. Esta es la razón clave por la que la mayor parte del trabajo existente, presentado en subsecciones
subsecuentes, se ha enfocado en el análisis de datos en vez de Big Data es que la revolución de Big Data, es
decir, la capacidad procesar grandes cantidades de datos diversos a gran escala, tiene solo sucedió
recientemente. Los enfoques existentes pueden ser posiblemente extendido a los ambientes, tratando
con grandes, diversos conjuntos de datos.
Algunas herramientas basadas en ML se han desarrollado para Big Data analítica. La Tabla IX destaca
algunos de los más importantes. A mostrar la implementación de BDA, utilizamos MLlib (MLbase) código en
las subsecciones subsecuentes.
1) Estadística : En estudios científicos, riguroso y eficiente las técnicas se utilizan para responder preguntas
de investigación. Cuidadoso las observaciones (datos) constituyen la columna vertebral del
apuntalamiento investigaciones. La estadística es el estudio de coleccionar, analizar, y sacar conclusiones
de los datos, con los principales centrarse en seleccionar las herramientas y técnicas adecuadas en
cada etapa de análisis de datos [29]. Desde las colecciones de datos, analizarlo eficientemente, y luego
inferir o formular conclusiones de ello, todos estos pasos entran dentro del alcance de estadísticas
[30]. Varios campos de análisis están tomando prestado técnicas de estadística [29].
Ejemplos de investigación de construcción utilizando estadísticas: el la industria está empleando métodos
estadísticos en una variedad de áreas de aplicación, como la identificación de causas de retrasos en la
construcción [31], aprendiendo de los exámenes posteriores al proyecto (PPR) [32], decisión apoyo para
litigios de construcción [33], detectando daños a edificios [34], identificando acciones de trabajadores
y maquinaria pesada [35], [36], etc., por nombrar algunos.
2) Minería de datos : la minería de datos se ocupa de la exploración y el análisis automáticos o

semiautomáticos, de grandes volúmenes de datos, para descubrir patrones o reglas significativos. La
minería de datos tiene un alcance más amplio que otros datos tradicionales campos de análisis (como
estadísticas) ya que tiende a responder preguntas no triviales [37], [38]. Para el descubrimiento de patrones
y extracción, Data Mining se basa principalmente en la (s) técnica (s) a partir de estadísticas, aprendizaje
automático y reconocimiento de patrones [39], [40]. Se crean y prueban varios modelos para evaluar la
idoneidad de una técnica (o técnicas) particular para resolver el negocio dado. problema.Los modelos con la
mayor precisión y tolerancia son elegido y aplicado a los datos reales para generar predictores
resultados (incluidas las predicciones, las reglas, la probabilidad y el pronóstico) confianza).
Las bases de datos son cruciales para potenciar diversos aspectos de la minería de datos, en particular al
cuidar las actividades de acceso eficiente a los datos, agrupar y ordenar operaciones y optimizar las
consultas para ampliar los algoritmos de minería de datos. Las bases de datos proporcionan soporte nativo
para análisis en forma dealmacenamiento de datos . En el almacenamiento de datos, la copia de los datos
transaccionales se almacena específicamente estructurada para la consulta y el análisis [37], [41]. Los datos
transaccionales se recopilan de las bases de datos operacionales utilizando un proceso generalmente
conocido como Extraer, Transformar y Cargar (ETL) [42]. Los datos en el almacén generalmente se analizan a
través del procesamiento analítico en línea (OLAP) . OLAP supera a SQL en el cálculo de los resúmenes (roll-
up) y desglose (roll-down) de los datos.
Ejemplos de investigación de construcción usando Minería de Datos: Kim et al. [31] emplearon técnicas de
minería de datos para identificar los factores clave que causan demoras en los proyectos de
construcción. Presentaron el marco de descubrimiento de conocimiento en bases de datos (KDD) para
analizar conjuntos de datos de construcciónmasiva . Las limitaciones de los algoritmos de ML (como la
predicción incorrecta) se discuten y superan a través de métodos estadísticos. Buchheit et al. [43] también
presentó el proceso KDD para la industria de la construcción . Se considera que el preprocesamiento de
datos es el paso más desafiante y que requiere mucho tiempo . Además, Soibelman et al. [44] ilustró la
aplicabilidad de KDD a conjuntos de datos de construcción para identificar las causas de retrasos en la
construcción, sobrecostos y controles de calidad.
Carrilli et al. [32] utilizó la extracción de datos para aprender de proyectos anteriores y mejorar la entrega
futura de proyectos. Enfoques como el análisis de texto, el análisis de enlaces y el análisis de matriz
dimensional se realizan con datos de múltiples proyectos. Liao et al. [45] empleó minería de reglas de
asociación para prevenir proactivamente lesiones ocupacionales. En otro estudio similar [46], la minería de
datos se utiliza para explorar las causas y la distribución de las lesiones ocupacionales y reveló que las
caídas y los colapsos son las razones principales de las muertes ocupacionales. Mientras que Oh et al. [47]
empleó DW en datos de productividad de la construcción, que se utilizautilizando un análisis de múltiples
capas a través de OLAP en el sistema propuesto. SQL es bastante frecuente en la industria para
consultar modelos BIM parciales. Los lenguajes de consulta como Express Query Language (EQL) y Building
Information Modelling Query Language (BIMQL) se desarrollan en las diversas aplicaciones de subdominios
de la industria de la construcción [48], [49].
Estos conjuntos de datos subyacentes a la identificación de causas de retrasos, aprendizaje de
PPR, descubrimiento de conocimiento basado en BIM , prevención de lesiones ocupacionales, entre otros,
presentan evidentemente los 3 V de Big Data, y estas aplicaciones pueden extenderse fácilmente a esta
revolución emergente de Big Data Analytics para funciones como procesamiento eficiente de consultas de
modelos BIM parciales.
3) Técnicas de aprendizaje automático : el aprendizaje automático (ML), un subcampo de la Inteligencia
Artificial (IA), se centra en la tarea de permitir que los sistemas computacionales aprendan
automáticamente datos de tareas específicas. Las tareas de ML se pueden categorizar en: i) clasificación (o
aprendizaje supervisado); ii) agrupamiento (o aprendizaje no supervisado); iii) asociación; iv) predicción
numérica
[51].
ML tiene muchas aplicaciones a través de las aplicaciones de construcción, tales como el modelado del
razonamiento judicial y la predicción de los resultados del litigio se estudia a fondo utilizando enfoques de
aprendizaje basados en reglas [52], redes neuronales artificiales métodos [53], [54], [55], técnicas de
razonamiento basadas en casos [56 ], [57] y metodologías híbridas [58], [59]. Tales aplicaciones se discuten
mediante técnicas ML en las secciones posteriores.
A. Técnicas de regresión
La regresión es el método supervisado de ML , que se preocupa por predecir el valor numérico de
una variable objetivo basado en variables de entrada. Por ejemplo, estimar el costo de el diseño basado en
especificaciones de diseño. La regresión puede ser de los siguientes tipos. La regresión lineal simple que
se usa para modelar la relación entre una variable dependiente y y una variable explicativa x . Regresión
lineal múltiple que se utiliza para modelar la relación entre un dependiente variables (continuas) y dos o más
variables explicativas. Este es un enfoque de regresión comúnmente utilizado. La logística regresión que se
utiliza para modelar la relación entre en la variable dependiente categórica y una o más
explicativas variables. El Listado 1 muestra el código MLlib para demostrar la carga de datos, personalizar el
algoritmo de regresión, desarrollar el modelo , y finalmente usarlo para predecir el punto de datos.
val df = sq lCo ntex t. creat eDa t aFr ame (d ata) .toDF ( "etiqueta" , "características" )
valreg = new L ogisti cRe gression () . se tMa x I ter (1 5)

val model = re g. ajuste (df )
val we ights = modelo. pesas modelo. transfo rm (df ). mostrar ()
Listado 1. Una instantánea del código MLlib para análisis de regresión
Ejemplos de investigación de construcción usando regresión: Siu et al. [60] empleó regresión para predecir
los tiempos de ciclo de operaciones de construcción que utilizan el error de mínimos cuadrados y el cuadrado
medio menor. El enfoque se evalúa en la instalación de un proyecto Viaduct Bridge y se informa que tiene
una mayor precisión depredicciones Aibinu et al. [61] empleó regresión lineal para identificando los retrasos
en los proyectos de construcción. Sus hallazgos revelan que los excesos de costos y tiempo se producen con
frecuencia factores de retraso. Del mismo modo, Sambasivan et al. [62] estudiaron la relación del barco entre
la causa y el efecto de las demoras en Malasiaindustria de la construcción utilizando modelos de
regresión. Trost et al. [63] utilizó el análisis de regresión multivariable para predecir la precisión de la
estimación durante las primeras etapas de proyectos de construcción. Las estimaciones reciben puntajes
para ganar precisión de predicción Los resultados revelan que el puntaje estimado el modelo está
prediciendo la precisión con un significado muy alto. Chan et al. [64] emplearon análisis de regresión múltiple
para predecir el éxito asociativo de las partes contratantes. Fang et al. [65] aplicaron análisis de regresión
logística a explorar la relación entre el clima de seguridad y el individuo comportamiento. Los resultados
demuestran la relaciónvívida de clima de seguridad y comportamiento personal como género, estado civil ,
nivel de educación, número de miembros de la familia que apoyar, conocimiento de seguridad, hábitos de
bebida, empleador directo y comportamiento de seguridad individual.
B. Técnicas de clasificación
La clasificación es la técnica de aprendizaje supervisado en la cual programas emulan decisiones basadas
automáticamente en las decisiones correctas previamente hechas. La entrada a la clasificación algoritmos
es un conjunto particular de características, y el resultado es hacer una sola selección
de una lista corta de opciones (categóricas o mutuamente excluyentes). Se adapta a situaciones en las
que solo, pero más decisiones enfocadas están involucradas. Dado que estos algoritmos
aprenden por ejemplos, ejemplos cuidadosamente elaborados de decisiones correctas a un lado con los
datos de entrada son vitales para los algoritmos de aprende con precisión. Estos algoritmos aprenden a
imitar los ejemplos de derecho decisiones contrarias a la agrupación en qué algoritmos deciden por su
cuenta sin una guía previa. La clasificación tiene la intención para elegir una sola opción del conjunto
limitado de posibles elecciones. Los algoritmos de clasificación prominentes incluyen Logistic Regresión,
Naive Bayes, Árboles de decisión y Vector de soporte Máquina (SVM). Estos algoritmos se discuten un poco
en las secciones siguientes.
1 ) Naive Bayes Classifier : Naive Bayes es muy simple pero el popular algoritmo para crear una amplia
clase de clasificadores ML para diversas aplicaciones industriales. Se usa para calcular el probabilidades
conjuntas de valores con sus atributos (características) dentro del conjunto de casos dado. Los atributos son
considerados independientes uno del otro, y esta consideración se conoce como suposición ingenua de
independencia condicional. El clasificador hace esta suposición al evaluar casos. La clasificación se realiza
teniendo en cuenta la información previa y la probabilidad de que la información entrante constituya a
posteriori modelo de probabilidad, que puede ser denotado por la siguiente expresión.
Posterior =
( Prioridad _ Probabilidad ) = Evidencia (1)
El Listado 2 muestra el código MLlib para el clasificador Naive Bayes, donde los datos se dividen en
entrenamiento (60%) y prueba (40%), y se construye un modelo y se utiliza para hacer predicciones.
valsplits = analizar dDa t a. rand omSp lit (Ar r ay (0. 6, 0. 4) ,

semilla = 11L)
valtraining = splits (0 )
valtest = splits (1 )
val model = NaiveBayes. tren ( lluvia, lambda = 1. 0, modelType = "mu ltin omi al" )
valpredictio nAn dLa bel = tes t. mapa (p = > (modelo. predecir ( características p . ) , p. labe l) )
valaccuracy = 1. 0 _ predicción nAn dLa ser l. filtro (x = > x. 1 == x. 2) . count () / test. contar ()
Listado 2. Un fragmento de código MLlib para Naive Bayes
Ejemplos de investigación de construcción usando clasificadores Naive Bayes: Jiang et al. [34] presentó una
metodología probabilística bayesiana para detectar los daños estructurales. La métrica de evaluación del
factor Bayes se calcula a partir del teorema de Bayes y la suposición de distribución gaussiana para la
identificación precisa del daño. La efectividad de las técnicas propuestas se reporta para evaluar la
confianza en el daño de las estructuras en cinco escenarios dañados de edificios de cuatro niveles de
referencia. Gong et al. [35] presentó un marco para la automatización clasificación de acciones de
trabajadores y maquinaria pesada en escenarios de construcción complejos. Emplearon Bag-of- Video-
Features-Model junto con la probabilidad bayesiana de evaluar y ajustar el descubrimiento de acciones. Se
revela que el enfoque propuesto es capaz de identificar varias acciones en situaciones altamente
complejas y es más rápido que el tradicional métodos. Huang et al. [36] estudió el efecto de la carga
severa eventos, a saber, terremotos o degradación ambiental prolongada, en estructuras civiles. Un marco
probabilístico bayesiano es propuesto para calcular la reducción de rigidez. Usando simulado datos, el
enfoque propuesto se encuentra para medir la rigidez precisamente. Los enfoques mencionados
anteriormente son reportados revelado como intensivo en cómputo; por lo tanto, requieren
contemporáneo Las tecnologías Big Data para una mayor precisión y respuesta.
2) Árboles de decisión : los árboles de decisión (DT) es el moderno ML método para predecir
el objetivo cualitativo y cuantitativo caracteristicas. El proceso de construcción de DT comienza con la
identificación nodo de decisión y luego dividir recursivamente los nodos hasta que no haya más las
divisiones son posibles. La solidez de DT depende de la lógica para dividir nodos, que se evalúa usando
conceptos tales como ganancia de información (IG) o reducción de entropía. El Listado 3 muestra el código
MLlib para mostrar la implementación de DTs; los datos se divide en conjuntos de entrenamiento y prueba,
parámetros inicializados, DT creado y se evalúa el modelo usando datos.
valsplits = dat a. rand omSp lit (Ar r ay (0 , 7, 0 , 3) )
val (t rai nDa ta, tes tDa ta) = (splits (0), splits (1))
val numCl as se s = 2
características valógicas I nfo = Mapa [I n t, I nt] ()
val imp urity = " gini"
val maxDepth = 5
val maxBins = 32
val model = De cisio nTr e e. train C lasifier (t rai nDa ta,
numClas ses, categórica F comeures n nfo, imp urity,
maxDepth, maxBins)
vallabe lAn dPr eds = tes tDa t a. mapa f punto = > val
predicción = modelo. predecir (característica de p . p . s) (
poin t. labe l, predicción)
Listado 3. Un fragmento de código MLlib para árboles de decisión
Ejemplos de investigación de construcción usando árboles de decisión: Pietrzyk et al. [66] estudió la cuestión
de la germinación de moho en las estructuras de construcción mediante el análisis de árbol de
fallas. Las deficiencias relacionadas con la estructura que se introducen durante el proceso de
construcción se identifican y clasifican. Se genera un modelo de cuantificación probabilística para comparar
las estructuras de construcción en función de su tendencia a la germinación de moho. Desai et al. [67]
han empleado árboles de decisión para analizar y evaluar la productividad laboral en la industria de la
construcción. El algoritmo de árbol de decisión tradicional está ligeramente personalizado para adaptarse
a los datos de construcción, que según se informa ha mejorado la precisión de la propuesta metodología,
con resultados más realistas.
3) Máquinas de vectores de soporte (SVM) : SVM es una técnica ampliamente utilizada que se destaca por
ser práctica y teóricamente sólida, simultáneamente. SVM está arraigado en el campo de la teoría del
aprendizaje estadístico, y es sistemático: por ejemplo, el entrenamiento de un SVM tiene una solución única
(ya que implica la optimización de una función cóncava). SVM usa métodos kernel para mapear datos desde
entrada / espacio paramétrico a un espacio de características dimensionales de mayor nivel. El Listado 4
muestra el código MLlib para ilustrar SVM, donde el algoritmo construye un modelo , calcula la precisión en
los datos de prueba y evalúa el modelo .
1 valsplits = dat a. rand omSp lit (Ar r ay (0. 6, 0. 4) , 63
2 semillas = 11 L) 64
3 valtrain = splits (0 ). ca che () sesenta y cinco
4 valtest = splits (1 ) 66
5 67
6 valn umI terations = 100 68
7 modelo val = SVMWithSGD. tren ( lluvia, n omaciones) 69
8 70
9 valscor eAn dLa bels = tes t. mapa f punto = > 71

10 valscore = modelo. predecir (función de p . p . s) (puntaje, 72
poin t. Labe l) g 73
11 74
12 val me trics = new B inary C lasificatio nMe trics ( 75
scor eAn dLa bel s) 76
Listado 4. Un fragmento de código MLlib para SVM
Ejemplos de investigación de construcción usando SVM: para identificar los daños en puentes, Liu et al. [68]
emplearon SVM y algoritmos genéticos (GA). La selección, el cruce y la mutación en GA se utilizan para
seleccionar los mejores parámetros del kernel que se usan en SVM como parámetros del modelo. Se
presenta una simulación numérica para ver la viabilidad del enfoque propuesto. El análisis comparativo
de GA-RBF (función de base radical) y GA-BP (redes de propagación de retorno) se lleva a cabo, lo que revela
que la técnica propuesta ha superado con creces estos enfoques utilizados anteriormente significativamente
para la identificación de daños en puentes.
Mahfouz et al. [69] estudió la clasificación automatizada de documentos de construcción utilizando
modelos, basados en SVM y análisis semántico latente (LSA). La precisión de clasificación de estos modelos
se compara y contrasta con el estándar de oro de las medidas de acuerdo humano. Se obtienen resultados
relativamente mejores (con una precisión entre el 71% y el 91%) que los modelos utilizados anteriormente.
En otro estudio [70], se desarrolló un sistema de apoyo a la decisión legal de construcción usando SVM. Los
modelos SVM extraen los factores legales de casos anteriores para ayudar a los jueces a verificar los
fundamentos de sus veredictos . Se comparan y contrastan los resultados de los modelos SVM de núcleos
polinomiales de primer, segundo y tercer grado. Se revela la mayor precisión para el SVM polinómico de
primer y segundo grado, del 76% y 85% respectivamente, implementado utilizando TF-IDF. Del mismo
modo, SVM se utiliza en el sistema de detección de fallas para HVAC en condiciones reales de trabajo [71].
Se desarrollan los clasificadores SVM para detección y aislamiento de fallas (FDI). El enfoque propuesto
puede detectar y aislar eficientemente muchas fallas típicas de HVAC.
4) Redes neuronales artificiales (ANN) : los algoritmos de las redes neuronales artificiales (ANN) son
adecuados para los problemas de clasificación o estimación de funciones. Desde su llegada, estos algoritmos
son ampliamente utilizados en la solución de problemas industriales complejos. El perceptrón multicapa
(MLP) es el tipo más utilizado de ANN. Las RNA generalmente se componen de tres capas, incluida una capa
de entrada , capa oculta (intermedia), 112
y capa de salida.
Las muestras de datos en la red neuronal MLP se normalizan y se introducen en la capa de entrada. Estos
datos se mueven desde la capa de entrada a una o dos capas ocultas y finalmente se pasan a la capa de
salida, produciendo una salida del algoritmo ANN dado. Normalmente, x : y : z se utiliza para describir la
topología ANN en la que x , y , z corresponde a la cantidad de nodos en las capas de entrada, ocultas y de
salida, respectivamente. Durante la fase de entrenamiento , los valores de las conexiones entre nodos
(también conocidos como pesos) son equilibrado. La propagación de la espalda, el recocido simulado y
los algoritmos genéticos se utilizan comúnmente para el entrenamiento de las RNA. El Listado 5 muestra el
código MLlib para explicar las etapas del ciclo de vida del desarrollo y evaluación del modelo ANN .
13 1 valsplits= dat a. rand omSp lit (Ar r ay (0. 6, 0. 4) , se ed
14 = 1234L)
15 2 valtrain = splits (0 )
16 3 valtest = splits (1 )
17 4
18 5 vallayers = Ar r ay [I n t] (4, 5, 4, 3)
19 6
20 7 valtrainer = new Mu ltilayer P erceptron C elsificador ()
21 8 . establecer L ayers (l ayers). se tBl ock S ize (1 2 8)
22 9 . establecer S eed (1234L ). se tMa x I ter (1 0 0)
23 10
24 11 modelo val = aprendiz r. ajuste (t lluvia)
25 12 valresult = modelo. transfo rm (t est)
26 13 valpr e dictio nA dLa bels = resultado
27 14 . select ( " predicción" , "etiqueta" )
28 15 valevaluator = nuevo
29 Mu lticlass C lasification E valuator () .
30 se tMe tri cNombre ( " precisión" )
Listado 5. Un fragmento de código de MLlib para ANN
Ejemplos de investigación de construcción usando ANN: Chen et al. [72] ANN a medida para detección de
fallas de estructuras de ingeniería , causadas por vibración y fatiga. Según los informes, el enfoque se revela
para obtener mejores resultados en fallas estructurales diagnóstico. Fang et al. [74] empleó ANN para
la detección de daños estructurales . El algoritmo de propagación de la espalda, habilitado por el método de
descenso más inclinable, basado en la heurística, se utiliza para el entrenamiento de la red neuronal. Las
funciones de respuesta de frecuencia (FRF) se usan para la detección de daños estructurales. Se analiza un
caso de estudio de la viga en voladizo para tipos de daños invisibles, únicos y múltiples . Del mismo modo,
ANN se emplea junto con GA en [73] para la clasificación de fallas, en el que ANN y GA se complementan
entre sí en la reconstrucción de los datos de entrada faltantes. Moselhi et al. [75] deliberó sobre la utilidad
de ANN sobre los sistemas convencionales basados en expertos , empleados en el desarrollo varias
aplicaciones para la industria de la construcción . Se describe una arquitectura genérica basada en redes
neuronales, que se valida implementando una aplicación para una estimación de marcado óptima . Se
argumenta que los sistemas inteligentes basados en ANN garantizan un rendimiento ideal sobre los
sistemas, desarrollado usando enfoques basados en sistemas expertos convencionales.
Los algoritmos ANN recientemente han revolucionado el aprendizaje automático a través del aprendizaje
profundo. Los nuevos algoritmos de ANN están diseñados para aprender de datos de alta dimensionalidad
(es decir, Big Data), que buscan atención especial en todas las aplicaciones de la industria de la
construcción donde se emplea ANN.
5 ) Algoritmos genéticos (GA) : los algoritmos genéticos (GA) son algoritmos de ML evolutivos que se
inspiran en el proceso de evolución natural. Calcula mejores soluciones para problemas de
optimización utilizando conceptos tales como herencia, mutación, selección y crossover . Típicamente, los
algoritmos GA implican la creación de dos componentes integrales, que incluyen (i) representación genética
(conjunto de bits) del problema y (ii) una función de aptitud para evaluar el dominio de la solución. El
proceso comienza con iniciar una solución al azar y luego sigue mejorando
mediante la aplicación iterativa de mutación, cruzamiento , inversión y selección, a menos que se
encuentre una solución óptima .
Ejemplos de investigación de construcción usando GA: Chen et al. [76] utilizó GA para desarrollar un sistema
de planificación integrada de costos / cronogramas (CSIPS) que se enfoca en asignar tripulación de manera
óptima bajo un conjunto complejo de restricciones relacionadas con recursos y mano de obra . La pareja GA
con BIM y la matriz de secuenciación de objetos se usa para lograr la asignación de tripulación en el sistema
CSIPS. Del mismo modo, Moon et al. [77] desarrolló un sistema BIM activo para evaluar los riesgos
impuestos por el cronograma y los conflictos en el espacio de trabajo que suelen ocurrir durante la
fase de construcción de un proyecto. Este sistema BIM activo usaba algoritmos difusos y GA para generar de
manera eficiente el plan óptimo para conflictos en el espacio de trabajo.
6 ) Análisis de documentos latentes (LDA) / Análisis semántico latente (LSA) : LSA determina el significado
de las palabras en un gran corpus de documentos utilizando técnicas estadísticas. Utiliza el método
de descomposición de valor singular como toda su base para el cálculo. Es ampliamente utilizado en el
análisis de texto, donde se utiliza para el reconocimiento de vocabulario, categorización de palabras,
preparación de frases, comprensión del discurso y evaluación de la calidad del ensayo. LSA se basa en las
siguientes medidas.
1 valcorpus = parse dDa t a. zi pWi th I nde x. mapa (. swap) . 88
ca che () 89
2 val ldaModel = nuevo LDA () . se tK (3 ). correr (c orpus) 90
3 valtopics = ldaModel. tema sMa trix 91
Listado 6. Un fragmento de código MLlib para análisis semántico latente
1) Precisión: es la fracción de los documentos recuperados , que son relevantes. Es útil para evaluar la
calidad de los enfoques de LSA.
2) Rellamada: es la fracción de los documentos relevantes que se recuperan. Recordemos sobre todo
informa sobre la completitud de los enfoques de LSA.
3) F-Measure: se usa a menudo para combinar la precisión y el recuerdo para evaluar la precisión de las
pruebas. El Listado 6 muestra el código MLlib para demostrar la implementación de LDA, donde se crea un
corpus y los documentos se agrupan según la distribución de palabras.
Ejemplos de investigación de construcción usando LDA y LSA: Kandil et al. [79] empleó LSA para la
clasificación automatizada de documentos de construcción. La técnica propuesta clasificó dos conjuntos de
documentos: (1) documentos con bajas variaciones de palabras (reclamaciones y documentos legales) y (2)
documentos con variaciones de palabras elevadas (correspondencia y actas de reuniones ). La evaluación de
la técnica propuesta proporcionó resultados de clasificación satisfactorios. Mahfouz et al. [69] emplearon
una metodología híbrida de clasificación de documentos de construcción basada en ML construida sobre
SVM y LSA. Los resultados presentados son relativamente mejores que los enfoques basados en
una sola técnica ML. Salama et al. [78] emplearon clasificadores basados en LSA para este propósito donde
las cláusulas de los documentos se clasifican automáticamente en categorías predefinidas como ambiental,
de salud, etc., antes de la extracción de reglas. Se informa que el método desarrollado logra el 100% y el
96% de recuperación y precisión, respectivamente.
7) Más investigación de la industria de la construcción que utiliza la clasificación : los algoritmos de
clasificación se han utilizado en la construcción para muchas tareas. En esta subsección,
discutiremos algunas de las aplicaciones importantes de clasificación para la industria de la construcción. En
particular, revisaremos la clasificación de documentos , el análisis de documentos, la clasificación basada en
imágenes, la clasificación para predecir el desbordamiento del proyecto y, finalmente, la clasificación para el
análisis de seguridad. Acentuadamente, estas aplicaciones necesitan ser renovadas con las tecnologías Big
Data, ya que presentan desafíos similares de alta dimensionalidad, velocidad y variedad. Además , estas
aplicaciones también implican cálculos con clase al realizar tareas específicas de dominio .
Clasificación de documentos : se diseñan diferentes técnicas para clasificar automáticamente documentos
basados en varios sistemas de clasificación como CSI MasterFormat, CSI UniFormat y UniClass. Caldas et
al. [80] usó SVM para organizar documentos de construcción basados en las clases CSI MasterFormat. los la
relevancia de los documentos con términos se calcula mediante ponderación booleana , frecuencia
absoluta, TF / IDF y ponderación IFC. El sistema prototipo se evalúa y se encuentra muy relevante. Rehman
et al. [81] clasificó los documentos de construcción en dos grupos distintos de información buena y mala que
contenía información documentos. Se emplea el enfoque de ML de tres capas. Decisión Los algoritmos de
Árboles (DT), Naive Bayes, SVM y KNN se utilizan para verificar la precisión de la clasificación. Excepto por el
DT, el resto de algoritmos ha mejorado significativamente la clasificación exactitud. De manera similar, Liu et
al. [ 82] presentaron el proceso de recuperación estructurada de documentos para documentos basados en
ingeniería administración.
Análisis de documentos : Soibelman et al. [83] propuso una plataforma integral para almacenar y analizar
documentos no estructurados utilizados en un proyecto de construcción. El sistema captura los atributos
esenciales de estos tipos de documentos que contienen diversos datos sobre texto, web, imágenes y
enlaces, y los almacena en un formato analítico. Estos documentos se vinculan automáticamente con los
archivos binarios apropiados (creación de modelos) utilizando diferentes clasificadores ML, lo
que mejoró drásticamente la recuperación de información y redujo significativamente el tiempo de
búsqueda general de los administradores de proyectos.
Clasificación basada en imágenes : los registros de fotografía del sitio de construcción comprenden
una parte significativa de la documentación de construcción. En [84] se propone un novedoso sistema de
clasificación basado en ML que utiliza los algoritmos Transformación blanqueadora (WT), SVM
y Transformada discriminante sesgada (BDT) para clasificar e indexar las imágenes del sitio de construcción.
El enfoque propuesto ha impulsado significativamente los resultados de los motores de búsqueda
tradicionales.
Predicción del potencial de desbordamiento : Williams et al. [85] analizaron los datos de licitación del
proyecto de autopistas para las tendencias interesadas que informaban sobre los excesos del proyecto. La
exploración de datos reveló que las ofertas con índices más altos tienden a tener sobrecostos significativos .
Con base en estas proporciones (como variables independientes), se emplea un algoritmo basado en ML
automatizado (Ripple Down Rules) para clasificar el potencial de desbordamiento de los proyectos de
construcción en los siguientes valores discretos de Near , Overrun , BigOverrun . Esta exploración ha
revelado reglas interesantes para evaluar el dilema del exceso de costos del proyecto. Del mismo modo,
Elfaki et al. [86] exploró toda la amplitud de los sistemas inteligentes desarrollados utilizando diferentes
algoritmos ML para la estimación del costo del proyecto de construcción.
Análisis de seguridad : Han et al. [87] presentó un enfoque que usa videos del sitio para medir el
comportamiento de los trabajadores hacia la seguridad. El enfoque propuesto analiza el modelo de
movimiento del esqueleto 3D de los trabajadores para identificar sus acciones. Como se conocen acciones
seguras e inseguras, los datos de entrenamiento están etiquetados correctamente para acciones seguras e
inseguras, que el clasificador explota para aprender. Como caso de estudio, se analiza el movimiento del
trabajador al subir la escalera. Se revela que el clasificador puede identificar con éxito los movimientos que
potencialmente pueden conducir a lesiones en el sitio.
C. Técnicas de agrupamiento
La agrupación se usa para encontrar grupos que tienen similitudes en sus características. Intuitivamente, la
agrupación es similar a la clasificación no supervisada: mientras que la clasificación en el aprendizaje
supervisado asumió la disponibilidad de un conjunto de entrenamiento correctamente etiquetado, la tarea
no supervisada de la agrupación busca identificar directamente la estructura de los datos de entrada. Los
elementos de un clúster son similares entre sí, mientras que son diferentes de los elementos de otros
clústeres. Algunos de los ejemplos de algoritmos de agrupación incluyen K- medias, O -medias, K -medias
borrosas y dosel. El Listado 7 muestra el código de MLlib para agrupar datos usando K- Means y evaluar el
modelo utilizando Dentro de Set-Sum-of-Squared-Errors .
1 valn umCl usters = 2 88
2 valn umI terations = 20 89
3 valclusters = KMeans. train (p ass dDa ta, numClus ters, 90
n umI teration s) 91
4 val WSSSE = cluster s. computeCos t (p ass dDa ta) 92
Listado 7. Una instantánea del código MLlib para K-Means
Ejemplos de investigación de construcción usando agrupamiento: Ng et al. [88] utilizó la agrupación para
agrupar las instalaciones según las descripciones de deficiencias almacenadas en la base de datos de
evaluación de las condiciones de las instalaciones. Los resultados han demostrado que las deficiencias de las
instalaciones son únicas y siempre en función de la ubicación y el tipo de la instalación. Fan et al. [89]
empleó el agrupamiento para desarrollar un sistema de recuperación de casos de construcción para
identificar accidentes ocurridos en el pasado. El objetivo es resolver las disputas antes de provocar litigios e
interrupciones laborales. Se advierte que los enfoques basados en PNL funcionaron mucho mejor que las
técnicas de razonamiento basadas en casos, mientras que se midió la similitud de los documentos del caso.
En [90] se adopta un enfoque híbrido para agrupar documentos de proyectos de construcción
automáticamente . El enfoque utiliza inicialmente la agrupación para generar clases para estos documentos
en base a medidas de similitud textuales. Más tarde clasificador de texto se utiliza para clasificar los
documentos pertinentes de la sistema de información del documento de construcción. Este enfoque híbrido
ha mejorado drásticamente la recuperación y la F-medida. La agrupación se vuelve no trivial con conjuntos
de datos masivos que comprenden millones de dimensiones.
D. Procesamiento del lenguaje natural (NLP)

El PNL se preocupa por crear modelos computacionales que se asemejen a las habilidades lingüísticas
(lectura, escritura, escucha y habla) de los seres humanos. Proporciona conceptos básicos y métodos para el
procesamiento y análisis de texto, como etiquetado de parte del discurso (POS), tokenización, división de
oraciones, reconocimiento de entidades con nombre y etiquetado de roles semánticos, etc. Este campo
reúne diversas técnicas de lingüística computacional , reconocimiento de voz y síntesis de voz para
procesar lenguajes humanos.
Ejemplos de investigación de construcción usando NLP: El NLP tiene una amplia gama de aplicaciones para la
adquisición y recuperación de conocimiento en la industria de la construcción. Al-Qady et al. [91] utilizó NLP
para desarrollar ontologías a partir de documentos contractuales de construcción. Emplearon
la Identificación de relación conceptual basada en PNL utilizando el Análisis superficial (CRISP)
para extraer automáticamente los conceptos y las relaciones conceptuales del texto de los documentos
contractuales. El puntaje Kappa y la medida F han mejorado significativamente la adquisición de
conocimiento, al tiempo que construyen una ontología legal. Los trabajos en [92], [93], [94] propusieron un
sistema de extracción de información basado en PNL para automatización verificación de cumplimiento de
documentos regulatorios de construcción. Se ha desarrollado un conjunto de reglas de coincidencia de
patrones y resolución de conflictos que emplean características de texto sintáctico (sintaxis / relacionado
con la gramática) y semántico (significado / relacionado con el contexto) durante PNL tratamiento. Se
propone una técnica para etiquetar, separar y secuenciar elementos de documentos normativos para
generar una ontología de alta calidad . El algoritmo propuesto se prueba en los documentos reglamentarios,
recuperados de la Internacional
Building Code y los resultados son prometedores con mayor precisión y recuperación.
E. Recuperación de información (IR)

Los motores de búsqueda web son los ejemplos más comunes de sistemas IR , donde la información
se organiza típicamente como una colección de documentos. Los sistemas IR tratan principalmente
con datos textuales no estructurados (que no tienen esquemas definidos ). Además , estos sistemas también
pueden manejar datos complejos no estructurados como imágenes. La aproximación y la clasificación son
los atributos vitales de los lenguajes de consulta IR. Las consultas se especifican como términos
de búsqueda encapsulados en palabras clave y conectivos lógicos (AND & OR) . Estas consultas se evalúan
con una clasificación de relevancia basada en la aproximación , donde los documentos se identifican
y devuelven en función de su relevancia para una consulta.
Ejemplos de investigación de construcción usando IR: Demian et al. Alabama. [95] desarrolló el sistema
CoMem-XML para aumentar la búsqueda a través de la granularidad y el contexto. El sistema se ha
mejorado para la similitud contextual, que se revela de mayor utilidad y utilidad para los profesionales de la
construcción. Tserng et al. [96] desarrolló un sistema de IR llamado Knowledge Map Model System (KMMS)
para facilitar que los profesionales de la construcción administren y reutilicen los conocimientos de
construcción de una variedad de documentos no estructurados. Fan et al. [97] propuso un marco para
gestionar documentos de proyectos de construcción no estructurados en los que se utilizan diccionarios de
términos y documentos textuales de dependencia. El marco se evalúa y se revela su utilidad. Hsu et al. [98]
empleó minería de textos basada en el contexto para la exploración de documentos CAD en 3D. Los sistemas
tradicionales dependen en la denominación textual y requiere que los diseñadores memoricen e incorporen
estas descripciones dentro de los documentos de diseño. Con este fin, se desarrolla un sistema de
recuperación de documentos CAD (CCRS) basado en contexto para extraer el contexto de los documentos
CAD en el documento característico (CD) , que es explotado por el planificador de consultas para seleccionar
los documentos. Lin et al. [99] estudió la recuperación de documentos técnicos como diarios, patentes,
informes técnicos o manuales de dominio. Se desarrolla un sistema de IR basado en conceptos para ilustrar
la efectividad del enfoque de partición propuesto. Se muestra que el enfoque propuesto es
bastante útil para IR basado en conceptos de documentos técnicos. Al-Qasy et al. [100] introducido un
sistema de gestión electrónica de documentos (EDMS) para gestionar documentos de proyectos de
construcción. En el quid de este sistema se encuentra la idea propuesta del discurso documental , que
determina la similitud semántica de los documentos. Se implementa un algoritmo de clasificación, utilizando
el discurso del documento, para clasificar los documentos del proyecto. El sistema es evaluado por un
grupo de expertos.
IV. O PORTUNIDADES
A. Recursos y optimización de desechos
La rápida urbanización ha intensificado las actividades de construcción en todo el mundo, lo que provocó
que la industria de la construcción consumiera la mayor parte de los recursos naturales y produjera
desechos masivos de construcción y demolición (C & D) [101]. El impacto adverso de las actividades de
construcción en el medio ambiente tiene serias implicaciones en todo el mundo [102]. Los enfoques
existentes de gestión de residuos se basan en Waste Intelligence (WI) , que sugiere medidas correctivas para
gestionar los residuos solo después de que suceden [103]. Estos sistemas responden en su mayoría a
preguntas cerradas, como los residuos sabios del proyecto / sitio generados, el progreso hacia objetivos de
desecho definidos, y la comprensión de cómo una estrategia de diseño particular produce desperdicio
[104]. A los usuarios finales se les proporciona una visión retrospectiva con una visión limitada sobre la
minimización de residuos.
Sin embargo, la toma de decisiones basada en datos en la etapa de diseño revela una revolución para
prevenir una proporción significativa de los desechos de la construcción [105], [104]. Esto obliga a un
cambio paradigmático de la noción estática de WI a una idea más progresiva de Waste Analytics (WA) [106].
La minimización de residuos a través del diseño es el futuro de la investigación de gestión de residuos [101].
WA aboga por análisis proactivos de conjuntos de datos desagregados y masivos para descubrir
correlaciones no obvias relacionadas con el diseño, las adquisiciones, los materiales y la cadena de
suministro, lo que podría ocasionar desperdicios durante la etapa de construcción real . Explora los datos de
desecho de forma prospectiva [104], [106]. Se podrían utilizar enfoques analíticos avanzados para
pronosticar los desechos y
prescribir el mejor curso de acciones para minimizar de manera preventiva residuos.
Sin embargo, WA depende cada vez más del cálculo de alto rendimiento y del almacenamiento de datos a
gran escala. Requiere una cantidad significativa de datos diversos sobre el diseño del edificio,
las propiedades del material y las estrategias de construcción para llevar a cabo con éxito el
proceso. Almacenar estos conjuntos de datos, utilizando tecnologías tradicionales, no solo es insuperable,
sino que el procesamiento en tiempo real para respaldar modelos analíticos de alta dimensión es
altamente desafiante. Esto requiere la aplicación de tecnologías Big Data para una gestión eficaz de los
residuos de la construcción. En particular, los modelos robustos de estimación de generación de residuos,
la selección óptima de materiales basada en BIM durante la especificación del diseño y el marco de
minimización integral de residuos son áreas clave de investigación
que requieren el uso de las aplicaciones de estas tecnologías Big Data . La Tabla XIV resume el estado del
arte y las posibles oportunidades para la optimización de recursos y residuos. Algunas de estas
oportunidades se explican con más detalle en la Sección V.
B. Servicios de valor agregado
En esta sección se analiza una amplia gama de servicios no básicos, que pueden beneficiarse de la tendencia
emergente de Big Data en la industria de la construcción .
1) Diseño Generativo : El diseño Generativo (GD) es otro cambio de paradigma en la industria de la
construcción. La idea es generar muchos diseños de forma automática en función de los objetivos de
diseño especificados , como requisitos funcionales, tipo de material , método de fabricación, criterios de
rendimiento y restricción de costos , entre otros. Las herramientas GD previstas emplean sofisticados
algoritmos para sintetizar el espacio de diseño y generar una amplia variedad de soluciones de diseño que
cumplen los requisitos de diseño establecidos. Estos diseños se presentan a los diseñadores para su
evaluación en función de su rendimiento. Esta evaluación permite a los diseñadores reiterar los diseños
ajustando los objetivos de diseño y las limitaciones a menos que se produzca un diseño para su
diseño. satisfacción. Los avances en este campo pueden traer muchos beneficios, particularmente para la
optimización de recursos y la reducción de desperdicios a través del diseño.
Se hacen intentos para verificar la adecuación de esta idea. Con este fin, Autodesk ha creado
la herramienta Dreamcatcher , para facilitar a los diseñadores, la generación de diseños basados en los
requisitos de diseño abstracto. Sin embargo, Dreamcatcher todavía está en su infancia y está lejos de ser
una herramienta prometedora para su uso con fines profesionales. Muchos desafíos subyacentes para lograr
GD de manera realista . Particularmente, la generación y
la exploración del espacio de diseño requiere mucho tiempo y es masiva. La herramienta debe generar y
comparar una permutación de modelos para el requisito de cliente único . Este campo requiere más I + D
para que la madurez sea utilizable en el grado empresarial aplicaciones. Estos desafíos de las herramientas
de GD son expresamente la jurisdicción del uso de tecnologías Big Data. Sin duda, estas tecnologías pueden
traer nuevos niveles de usabilidad, accesibilidad y democratización en la exploración y optimización del
diseño en las herramientas GD de próxima generación. La Tabla XIV resume el estado del arte y las
oportunidades potenciales para este subdominio .
2) Detección y resolución de choques : la identificación de choques de diseño es una parte
integral del modelo de construcción . Idealmente, esta fase debe llevarse a cabo antes del inicio de la etapa
de construcción para una gestión efectiva del proyecto. Los enfoques tradicionales basados en papel son
ampliamente sustituidos por enfoques automatizados habilitados por BIM, que se consideran relativamente
ineficientes y menos precisos para identificar la mayoría de los conflictos de diseño. Sin embargo, las
soluciones de resolución de conflictos habilitadas por BIM existentes son todavía tediosas y consumen
mucho tiempo para la automatización eficiente de procesos. . Hay dos aspectos de estos sistemas. En
primer lugar, la gestión adecuada del conocimiento es la clave de estos sistemas para lograr la
precisión. Wang et al. [38] propuso un sistema basado en el conocimiento para adquirir, formular y
desplegar conocimientos en la coordinación de diseño MEP habilitada por BIM.
Sin embargo, se necesita mucho en esta dirección. Además, para el posterior, la identificación de conflictos
de diseño requiere algoritmos no triviales para la exploración del diseño, que consumen mucho
tiempo. Estos aspectos son el tema de las tecnologías de Big Data, que pueden aumentar la representación
del conocimiento así como la computación a través de sus bien conocidas capacidades computacionales
distribuidas y paralelas. La Tabla XIV resume el estado del arte y las oportunidades potenciales para
este subdominio .
3) Predicción del rendimiento : los modelos de predicción de rendimiento han sido de amplia aplicación en
varios ámbitos de la industria de la construcción. Particularmente, estos modelos son instrumentales para
los sistemas de gestión de pavimentos, donde los ingenieros de sistemas se ven facilitados para tomar
decisiones correctas mientras construyen, mantienen y rehabilitan las estructuras del pavimento. Estos
modelos usan una gran cantidad de variables y su gran combinaciones, en las que se influyen mutuamente,
así como el rendimiento general del modelo, y se desarrollan utilizando un enfoque estadístico simple (como
la regresión lineal) para las técnicas de inteligencia computacional (como ANN). Karagah et al. [109] evaluó
varios modelos de predicción para predecir su precisión para las tendencias de deterioro del pavimento. Su
evaluación muestra que estos sistemas implican un análisis inteligente de cómputo, que consume mucho
tiempo y es difícil de procesar en tiempo real para las tecnologías tradicionales . Además, se destaca que la
alta dimensionalidad es inherente al conjunto de datos producidos para estas aplicaciones, donde el número
extremadamente grande de variables contribuye al desarrollo del modelo. Para este fin, campo de
predicción del rendimiento ofrece oportunidades para utilizar tecnologías Big Data. En consecuencia, las
tecnologías Big Data son de gran relevancia y pueden ayudar en el área en relación con el cálculo en tiempo
real, el desarrollo de modelos confiables y la visualización mejorada . La Tabla XIV resume el estado del arte
y las oportunidades potenciales para este subdominio .
4) Visual Analytics : los problemas analíticos son de dos tipos: (1) los problemas que tienen soluciones
lógicas y claramente definidas ; y (2) los problemas que tienen soluciones heurísticas aproximadas (y no
se aplica ninguna solución lógica basada en soluciones directas). La primera categoría se maneja a través de
enfoques automatizados, mientras que las últimas se abordan a través de la visualización. El conocimiento
humano, la creatividad y la intuición son fundamentales para la visualización efectiva. El conocimiento
humano funciona perfectamente con los conjuntos de datos más pequeños, pero su aplicación en la
participación de altas dimensiones grandes conjuntos de datos se convierte en impracticable. El campo de
Visual Analytics (VA) nació para combinar el razonamiento y la visualización automatizados para resolver
problemas analíticos complejos. Dichos sistemas son fenomenales para potenciar las capacidades
analíticas de los usuarios mientras perciben, comprenden y razonan sobre situaciones complejas e inciertas.
VA es uno de los dominios clave que requieren tecnologías Big Data para ejecutar la visualización de
datos para proporcionar vistas personales y exploración interactiva de datos.
Una de las razones clave detrás de la adopción generalizada de BIM radica en su capacidad de visualización
versátil. El software existente es bastante competitivo para visualizar todas las dimensiones (nD) del diseño
utilizando el conjunto adecuado de herramientas y técnicas. En este contexto, Castronov et al. [110] estudió
el papel de la visualización en el manejo de la construcción 4D. Se identifican las deficiencias de la
visualización BIM existente , y se prescriben pautas / protocolos generales para desarrollar la visualización
4D en herramientas de autoría BIM. Para permitir la participación de usuarios BIM técnicamente no
calificados, Zhadanovsky et al. [154] estudió el problema de la generación de visualización del plan maestro .
Del mismo modo para promover uso de energía sostenible, Goodwin et al. [111] empleó VA para clasificar a
los usuarios de energía. Los datos del consumo de energía de los hogares junto con los datos
geodemográficos se utilizan para obtener información más detallada. Se informa que la clasificación
permite clusters y tendencias para comprender el uso de energía . Sin embargo, el estado de se necesitan la
técnica de los enfoques de la agrupación de visualización durante el proceso de toma de decisiones y para
permitir la comprensión global. Chuang et al. [112] estudió el desarrollo de un sistema basado en
web habilitado para la nube para la visualización y manipulación BIM. los el sistema mejoró la comunicación
y la distribución de información relevante entre las partes interesadas.
El alcance de BIM se está ampliando con más aplicaciones desde la construcción, así como la etapa
FM ha comenzado a utilizarlo y ampliarlo. A medida que crecen los datos BIM, estos modelos se vuelven
altamente dimensionales, por lo que la visualización de modelos BIM de alta dimensión es un desafío. VA es
esencial tanto para BIM como para Big Data y proporciona técnicas sofisticadas para mejorar la visualización
de BIM y Big Data para una mejor comprensión y interpretación. La Tabla XIV resume el estado del arte y las
5) Servicios de redes sociales / Análisis : la mayoría de los problemas de la industria de la construcción
están relacionados con la comunicación [113]. Las redes sociales son otra tendencia interesante que puede
ayudar a la industria a mejorar la comunicación entre el equipo del proyecto. Esta tendencia está
penetrando lentamente en la industria. Los servicios de redes sociales para compartir información
actualizada sobre proyectos junto con prácticas más amplias para comunicar las mejores prácticas de
sostenibilidad podrían ser las siguientes áreas de aplicación.
Algunos estudios se han llevado a cabo en estas direcciones. Jiao et al. [113] estudió el uso de las redes
sociales para comunicar los datos de gestión de proyectos, incluidos los horarios, los datos de seguimiento
del progreso y las asignaciones de trabajo. El enfoque propuesto facilita la integración de datos de proyectos
útiles con BIM. Meadati y col. [114] estudió la integración de RFID, BIM y redes sociales para ayudar a los
administradores de instalaciones a localizar datos de múltiples documentos. Jiao et al. [115] trajo el entorno
AR basado en web3D para la integración de BIM y servicios de redes sociales comerciales (BSNS) a través de
la plataforma habilitada para la nube. El objetivo es mejorar la comprensión general de los modelos BIM.
Sin embargo, se requiere un marco sólido para capturar cada interacción social útil en el BIM desde el
diseño hasta el final de la vida útil del edificio. Dado que es probable que los datos de las interacciones
sociales sean de variedad, velocidad y volumen, las tecnologías Big Data podrían aprovecharse para
desarrollar aplicaciones de dominio interesantes para mejorar la productividad de las partes interesadas. La
Tabla XIV resume el estado del arte y el potencial 67
oportunidades para este subdominio .
6) Servicios personalizados : en servicios personalizados, el énfasis principal radica en una adaptación de las
instalaciones dadas en función de la elección del usuario. Los usuarios tienen la facultad de controlar el uso
general de los servicios de la forma que desean. Estos sistemas se adaptan en función de diversos
parámetros, como el comportamiento del usuario. La entrada a tales servicios podría ser tanto manual como
automática.
Gao et al. [116] desarrolló el sistema SPOT + para permitir a los trabajadores de oficina personalizar el
confort térmico interior. SPOT + usó Predictive Personal Vote (PPV) para ajustar automáticamente el confort
térmico interior que involucra principalmente el calentamiento. El sistema enciende la calefacción antes
de la llegada de los ocupantes, mientras que apaga la calefacción inmediatamente después de su partida.
Rabbani et al. [117] propuso un sistema de confort térmico personalizado mejorado denominado SPOT *
que permite a los usuarios ajustar los límites inferior y superior de la temperatura interior como se desee,
que se regula automáticamente en consecuencia. SPOT * admite calefacción y refrigeración de espacios
interiores. El sistema tiene un potencial significativo para reducción de energía mientras se mantiene la
comodidad general al nivel deseado. Panagopoulos et al. [118] propuso el sistema AdaHeat que usa agentes
inteligentes para regular la calefacción para el consumo doméstico . Un aspecto novedoso de este sistema
es que requiere una mínima intervención del usuario. Chen et al. [119] estudiaron la correlación del
comportamiento humano y el consumo de energía en hogares inteligentes. Se desarrollan modelos
computacionales para predecir el consumo de energía en función del comportamiento del usuario. Estos
modelos se utilizan para desarrollar un sistema basado en la web que proporciona al usuario información
basada en el comportamiento para un consumo de energía óptimo .
Las aplicaciones para habilitar servicios personalizados siempre requieren escanear el entorno de los
eventos de interés utilizando tecnologías de detección, generando grandes volúmenes de datos. Acumular
tales flujos de datos y luego procesarlos para generar conocimientos accionables en tiempo real para la
adaptación de un punto en el tiempo no es trivial y es el tema de interés para las tecnologías Big Data. Para
este fin, Big Data robusto
Se requiere una plataforma habilitada que proporcione una interfaz unificada para satisfacer las necesidades
de diversos servicios de personalización, empleados en edificios modernos. La Tabla XIV resume el
estado del arte y las oportunidades potenciales para este subdominio .
C. Gestión de instalaciones
La gestión de instalaciones (FM) integra los procesos organizacionales para mantener los servicios acordados
que respaldan y mejoran la efectividad de sus actividades principales. Las operaciones y la
administración son las partes centrales de FM y son la etapa más larga en todo el ciclo de vida de la
construcción. La mayoría de las actividades de FM (como la gestión de activos , el mantenimiento
preventivo, etc.) son laboriosas y la eficacia de tales tareas puede mejorar al incorporar una tecnología de
soporte adecuada. La información de localización es de gran importancia para estas soluciones
tecnológicas. Hoy estas instalaciones utilizan una automatización e integración avanzadas para medir,
controlar, controlar y optimizar las operaciones de construcción y mantenimiento. Brindan un control
adaptativo y en tiempo real sobre una variedad cada vez mayor de actividades de construcción en respuesta
a una amplia gama de flujos de datos internos y externos. A medida que aumenta la inversión y se ponen en
línea más sistemas inteligentes, más datos ingresarán a la plataforma de administración de energía a un
ritmo más rápido. velocidades
Taneha et al. [120] propuso un enfoque para determinar la información de ubicación personal de FM
utilizando tecnologías de localización para apoyar las actividades relacionadas con FM. El sistema
emplea tres tecnologías como RFID, LAN inalámbrica y unidades de medida inercial (IMU) para esta
localización. Para reducir el costo de FM, Ng et al. [121] el descubrimiento de conocimiento aplicado y la
minería de datos sobre las bases de datos de mantenimiento de las instalaciones. Liu et Alabama. [122]
evaluó las capacidades de BIM para apoyar el FM operaciones. Se identifican las necesidades detalladas de
los profesionales de FM para aprovechar BIM para respaldar tareas relevantes. Los factores que afectan la
mantenibilidad de las instalaciones se consideran principalmente.
Motamedi et al. [155] destacó tres desafíos enfrentados por la mayoría de los sistemas de FM. Estos
incluyen (i) interfaces de búsqueda ineficaces y lentas, (ii) ninguna interfaz unificada para que el sistema de
FM intercambie información, y (iii) incapacidad para almacenar y procesar grandes volúmenes de datos
generados por estos sistemas.Evidentemente, estos desafíos requieren las aplicaciones de las tecnologías Big
Data en el desarrollo de sistemas FM. Particularmente, en el caso del mantenimiento predictivo, BDA
puede informar a los gerentes de FM cada vez que es probable que el equipo se rompa o requiera una
actualización. En consecuencia, las organizaciones de FM podrían beneficiarse de menores gastos
operativos, mayores márgenes de ganancia y mayor disponibilidad del servicio. La Tabla XIV resume
el estado del arte y las oportunidades potenciales para este subdominio .
D. Gestión de energía y análisis
Dos tipos de software de energía son frecuentes. En primer lugar, la construcción de software de simulación
de energía para modelar el consumo de energía de los edificios. Su precisión depende de la precisión de
los parámetros proporcionados que los expertos ajustan. Este fino ajuste es laborioso y lleva mucho tiempo .
El ajuste fino automático implica muchos cálculos. Sanyal et al. [123] estudió la generación automática de
modelo de entrada precisa con el flujo de trabajo de Autotune propuesto para el software de simulación
de energía EnergyPlus . A modo de punta, se informa que el software opera con datos sin procesar
de aproximadamente 270 terabytes y lo condensa a aproximadamente 80 terabytes de datos útiles.
Almacenamiento de datos, transferencia, y el procesamiento de tales conjuntos de datos es inevitablemente
el tema
de las tecnologías Big Data.
En segundo lugar, los Sistemas de Gestión Energética de Edificios (BEMS) son vitales para los edificios. Y
como parte de su arquitectura, se instalan cientos o miles de sensores para capturar datos. Linda et al. [124]
utilizaron la detección de anomalías basada en la inteligencia computacional para fusionar datos de
múltiples heterogéneos
fuentes de datos y procesarlo para generar conocimientos accionables. A pesar de que los BEMS usan las
infraestructuras de multiprocesador de última generación, se informa que el problema de la gestión y el
procesamiento de los datos ha impuesto los límites de estos sistemas. Hong et al. [125] propuso un sistema
de almacenamiento basado en la nube para almacenar y procesar los datos de energía generados a partir de
una red de miles de sensores Zigbee. Para persistir en estos datos, Singh et al. [126] propuso el
almacenamiento basado en la nube y la arquitectura de procesamiento. Berges et al. [127], [128] propuso
un enfoque novedoso para identificar dispositivos y sus eventos (encendido / apagado o bajo / alto) para
medir su consumo eléctrico precisamente a partir de la afluencia eléctrica . Según los informes, se reveló
que el enfoque propuesto requiere nuevas capacidades de gestión y procesamiento de datos para la
implementación en la vida real. Del mismo modo, Goodwin et al. [111] empleó el análisis visual para la
clasificación de usuarios de energía. Se destaca que los enfoques de visualización de vanguardia se
encuentran en el núcleo del proceso de agrupación, la toma de decisiones y la comprensión general
mejorada del consumo de energía. Wei et al. [128] propuso un marco basado en IOT para monitorear y
analizar el consumo de energía de Smart Buildings.
El software como se mencionó anteriormente presenta perfectamente las oportunidades para el análisis de
Big Data para avanzar en el campo. A grandes rasgos, los datos relacionados con la energía son de inmensa
importancia para diversos análisis, que generalmente son descartados por los propietarios de edificios y las
empresas de servicios públicos en un intervalo de tiempo. Presentar estos datos muy bien para
el análisis avanzado es la próxima frontera de la innovación en este campo. La Tabla XIV resume el
estado del arte y las oportunidades potenciales para este subdominio .
E. Otras tendencias emergentes que generaron Big Data
Esta sección presenta algunas tecnologías que amplificaron el advenimiento de Big Data en la industria de la
construcción. Su despliegue exitoso para avanzar en la industria es de hecho la función de análisis de Big
Data.
1) Big Data con BIM : Building Information Modeling (BIM) está concebido para revolucionar la industria de
la construcción en muchos aspectos [156], [131]. BIM está habilitado con una capa adicional de datos,
capturados a lo largo de todo el ciclo de vida del edificio [131], [132]. Esta información se puede desatar
para desarrollar aplicaciones útiles para mejorar el proceso general de entrega de la
construcción. Teóricamente, el BIM se declara como el estándar de facto para la gestión de datos de
edificios; sin embargo, sus aplicaciones, en la práctica, en todas las etapas del ciclo de vida de la
construcción aún no se han desarrollado. Las etapas de preconstrucción son ampliamente conocidas por
adoptar ampliamente el BIM, mientras que, progresivamente, se usa menos en las etapas posteriores del
ciclo de vida del edificio [5]. Se hace una investigación sustancial para extender
BIM para encapsular diferentes tipos de datos relacionados.
Goedert et al. [133] amplió BIM para la documentación del proceso de construcción. Chiang et al. [157]
datos integrados de consumo de energía con modelos BIM. Isikdag et al. [134] datos integrados de sistemas
de información geográfica (GIS) con BIM para desarrollar un sistema de respuesta al fuego. Yeh et al. [158]
empleó BIM para la recuperación de información de construcción in situ
utilizando realidad aumentada . Wang et al. [38] amplió BIM para datos de conflicto espacial para modelos
MEP. Yu et al. [135] BIMserver integrado con OpenStudion (una plataforma para evaluar la eficiencia
energética de los diseños de edificios). Das et al. [20] BIM adaptado para las interacciones sociales que
tienen lugar mientras se revisan y comentan diferentes aspectos del diseño. Zheng et al. [136] BIM integrado
con diversas fuentes de datos de proyectos. Chaung et Alabama. [112] explotó BIM para la exploración y
manipulación de diseños habilitados para la nube . Jiao et al. [113] resolvió los problemas de la integración
de BIM con los cronogramas del proyecto, los datos de monitoreo de progreso y las asignaciones de
trabajo. Meadit et al. [114] integró datos de RFID en BIM para ubicar los documentos del proyecto. Volk y
col. [129] ilustró la creación automática de modelos BIM para edificios existentes.
Estos ilustran el aumento gradual en el tamaño y el alcance de los contenidos de los modelos BIM, que
finalmente restringe las capacidades del almacenamiento y procesamiento tradicional basado en
BIM. sistemas. Para hacer frente a esto, Jiao et al. [6] MapReduce adaptado para el almacenamiento y
procesamiento de BIM. Sin embargo, todavía hay muchos casos de uso que pueden requerir
personalizaciones sofisticadas para la forma en que BIM se almacena y se procesa. Entonces, en
el futuro, esperamos el almacenamiento y procesamiento de Big Data especializado de
BIM plataformas. Hasta hace poco, se preveía que BIM solo contenga datos de la industria de la
construcción ; sin embargo, la aparición de datos de edificios vinculados ha cambiado esta percepción. A
pesar de vincular datos BIM a aplicaciones interindustriales , se pueden desarrollar muchas aplicaciones
interesantes al permitir la integración de BIM con conjuntos de datos de Datos Abiertos Vinculados (LOD),
como clima, inundaciones, densidades de población, congestiones de carreteras, etc. [147]. Tal La
integración de BIM indudablemente da como resultado datos Big BIM, lo que justifica la aparición de Big
Data en el área especializada de BIM. La Tabla XIV resume el estado del arte y las oportunidades potenciales
para este subdominio .
2) Big Data con Cloud Computing : la computación en la nube es un paradigma informático de Internet en el
que se proporciona acceso bajo demanda a un grupo compartido de recursos configurables [159]. los La
idea es subcontratar el almacenamiento y el cómputo de datos a centros de datos de terceros . Múltiples
usuarios pueden acceder simultáneamente a los servicios en la nube sin tener que comprar licencias
individuales. Nube la computación ofrece tres modelos de servicio . (i) Infraestructura como servicio (IaaS) :
en IaaS, se proporciona al usuario una abstracción para administrar las computadoras virtuales / físicas y la
red en la nube servicios. (ii) Plataforma como servicio (PaaS): en PaaS, un usuario recibe servicios
relacionados con entornos de desarrollo tales como sistemas operativos, lenguajes de programación o bases
de datos, entre otros; (iii) Software como servicio (SaaS): en SaaS, el usuario tiene acceso a las aplicaciones
empresariales a través de
Internet , como Revit 360.
La computación en la nube es ampliamente adoptada en la industria de la construcción ya que admite la
integración de tareas basadas en BIM aplicaciones. Hong et al. [125] utilizó la computación en la nube
para construir sistemas de administración de energía usando sensores Zigbee. Das et al. [20] propuso un
marco BIM basado en la nube para integrar las interacciones de los interesados con BIM. Zhang et al. [136]
utilizó nubes privadas para ofrecer servicios BIM en todo el ciclo de vida del edificio. Klinc et al. [139]
propuso la plataforma SaaS para las aplicaciones de análisis estructural. Kumar et Alabama. [140] Nube
empleada para diseño y construcción de PYMES empresas. Chuang et al. [112] utilizó la computación en la
nube para la exploración y manipulación del diseño BIM . Redmond et al. [160] empleó la nube para la
interoperabilidad entre aplicaciones BIM. Amarnath et al. [161] implementó Revit Server en la nube para
colaboración y coordinación de modelos arquitectónicos y estructurales. Rawai et al. [162] exploró la
computación en la nube para desarrollos verdes y sostenibles. Fathi et al. [142] usó la nube para la
computación basada en el contexto basada en BIM. Beach et al. [143] discutieron los problemas de habilitar
Google SketchUp sobre la nube de Amazon EC2. Chong et al. [144] evaluó las aplicaciones de computación
en la nube existentes y destacó las aplicaciones de Google, Autodesk BIM 360 y Viewpoint, entre otros,
admiten la mayoría de las características de los diseñadores en la nube. Grilo et al. [145] utilizó la nube para
crear una plataforma de e-procurement-Cloud Marketplaces. Jiao et al. [113] explotó el marco de la nube
para integrar datos de gestión de proyectos con modelos de construcción. Jiao et al. [115] informática en la
nube integrada con las últimas tecnologías, como servicios de redes sociales AR y comerciales para crear un
entorno virtual para visualizar mejor y entender los modelos BIM. Wong et al. [137] destacó los problemas
legales relacionados con los modelos BIM basados en la nube, incluida la propiedad de seguridad,
responsabilidad, responsabilidad y diseño .
La computación en la nube ya ha acelerado la adopción de TI en la industria de la construcción mediante la
transformación de muchas aplicaciones específicas de dominio como se discutió anteriormente. Y el papel
de Big Data en esta transformación es abrumador. La Tabla XIV resume el estado del arte y las
3 ) Big Data con Internet of Things (IOT) : un hecho emocionante sobre Internet es que sigue evolucionando
desde su percepción. Comenzó con Internet-of-Computers y se convirtió en Internet-of-People , y
recientemente se enfrenta a un nuevo cambio de paradigma. Con las tecnologías emergentes más rápidas,
los dispositivos son cada vez más pequeños y potentes, y la conectividad de banda ancha es cada vez más
económica y omnipresente. Esto ha llevado a la proliferación de dispositivos conectados en Internet, lo que
finalmente dio como resultado una interesante tendencia acuñada como Internet-of-Things (IOT)
[150]. La visión principal detrás de IOT es reunir los dispositivos inteligentes y objetos de las partes vitales de
Internet. Fusionando estos emocionantes los mundos físico y digital están creando fascinantes
oportunidades de crecimiento. Algunas de las áreas populares donde las aplicaciones de IOT se demuestran
con éxito en todas las industrias incluyen logística, transporte, seguimiento de activos, hogares inteligentes,
edificios inteligentes, energía, defensa y gricultura.
Elghamrawy et al. [146] demostró el uso de RFID para la supervisión de la construcción y el control de
calidad. Meadati y col. [114] RFID integrado con documentos BIM 3D de activos para buscar y localizar
objetos rápidamente . Wei et al. [128] propuso un marco basado en IOT para la construcción de monitoreo
de energía. Zanella et al. [148] presentó las especificaciones de IOT urbano para visualizar la idea de Smart
Cities. Kortuem et al. [163] discutieron las especificaciones técnicas del objeto inteligente para las industrias
petroquímicas y de construcción de carreteras. Curry y col. [147] examinó el almacenamiento y
procesamiento de datos de sensores de energía utilizando un marco de gestión de datos basado en la nube.
Las aplicaciones de IOT no son triviales y a menudo implementan cientos o incluso miles de dispositivos de
sensores para la recopilación de datos. Dado que la industria de la construcción presenta casos de uso
ilimitados para IOT, Big Data es intrínsecamente el tema de interés. IOT y Big Data son tendencias
complementarias, con las primeras para generar grandes volúmenes de datos y las posteriores para
almacenar y analizar estos datos en tiempo real en el dominio específico de la construcción. aplicaciones. La
Tabla XIV resume el estado del arte y las oportunidades potenciales para este subdominio .
4) Big Data para edificios inteligentes : los edificios evolucionaron considerablemente con el tiempo. Al
tiempo que proporcionan comodidad y seguridad, 7 edificios causan un impacto ambiental adverso al
consumir energía y producir gran cantidad de gases de efecto invernadero [159]. Inteligente La tecnología
de la construcción es un cambio de paradigma para abarcar la integración de las tecnologías
contemporáneas con los sistemas de construcción predominantes para lograr el equilibrio entre
la maximización de la comodidad y la minimización de la energía [149]. Los sistemas de construcción
tales como la automatización de edificios, la seguridad de la vida , las telecomunicaciones, los sistemas
de usuario, los sistemas de administración de instalaciones, entre otros, proporcionan información práctica
sobre los diferentes aspectos de la construcción y permiten a los usuarios controlar sus interacciones con la
construcción
servicios mejor . El edificio inteligente incorpora tecnologías en los sistemas de construcción a través
de una vista unificada . A menudo, estos sistemas generan grandes cantidades de datos y la mayoría de
estos datos permanecen sin explotar y, a menudo, se descartan. Para realmente realizar edificios
inteligentes, es necesario analizar estos datos de tamaño sin precedentes , una tarea que presenta
importantes problemas de administración y procesamiento de datos . Con este fin, el análisis de Big Data es
de inmensa importancia para optimizar el rendimiento total del edificio a través del análisis predictivo.
McKinsey [159] destacó los edificios inteligentes entre los diez principales negocios de tecnología
emergentes. Azam et al. [149] implementó un prototipo de software Project Dasher para ilustrar Smart
Buildings. Los datos de los sensores relacionados con el movimiento, el CO 2 , la temperatura, el flujo de aire,
la iluminación y otras propiedades acústicas se recopilan y analizan. Según los informes, se reveló que se
acumularon más de 2 mil millones de entradas de datos en 3 meses que llegaron al límite de las bases de
datos relacionales heredadas. Stankovic et al. [150] desarrolló sistemas de lucha contra incendios basados
en sensores para la construcción de oficinas de rascacielos con las autoridades para detectar
incendios, alterar situaciones de incendio y ayudar en la evacuación. Bonino et al. [151] estudió el
procesamiento de eventos complejos en edificios inteligentes. Se propone el marco spChain para admitir
el procesamiento en tiempo real de los datos del sensor. Miller et al. [152] analizaron datos de
energía significativos a través del enfoque DayFilter propuesto para identificar con precisión los patrones
diurnos de los datos.
A pesar del hecho de que actualmente se utilizan sofisticados sistemas de TI para controlar varias
operaciones de construcción a través de 44 sensores con capacidades mejoradas de recopilación y análisis de
datos. Sin embargo, estos sistemas todavía están muy lejos de la visión real de las aplicaciones
de construcción inteligente que facultan al usuario final a comprender y controlar sus interacciones con los
sistemas y espacios de construcción [164]. Esta discrepancia se debe a las siguientes razones: (i) los servicios
y funcionalidades que se ofrecen actualmente son bastante rígidos; (ii) los servicios están aislados y las
soluciones robustas para la integración vertical y horizontal aún no están disponibles; y (iii) las aplicaciones
de apoyo y Las API suelen ser propietarias y carecen de estandarización en muchos casos. Por estas razones,
estas API sólo pueden ser explotadas por el propio software de BMS, y no son susceptibles a la
tercera - fiesta de desarrollo de aplicaciones, que restringe la innovación a escala. En el futuro, las API de
edificios estándar basadas en Big Data Analytics pueden salvar esta brecha tecnológica y permitir la
integración de sensores, usuarios, sistemas de control y maquinaria para proporcionar servicios innovadores
de construcción inteligente que prometen comodidad, seguridad y energía. La Tabla XIV resume las posibles
oportunidades de investigación sobre las aplicaciones de Big Data en 62
Edificios inteligentes.
5) Big Data con realidad aumentada (AR) : la realidad aumentada (AR), que es una derivación de la realidad
virtual, es el campo en el que los objetos virtuales generados por computadora se superponen sobre
escenas del mundo real para producir mundos mixtos . Permite un entorno semi inmersivo que alinea con
precisión las escenas reales con las correspondientes imágenes del mundo virtual . Esta superposición mixta
permite a los usuarios obtener información adicional sobre el mundo real. Es una tecnología emergente para
mejorar la percepción humana.
Rankohi et al. [165] argumentó que los aspectos de visualización y simulación de las aplicaciones de la
industria de la construcción se pueden renovar con AR para mejorar su usabilidad. Algunas de las áreas de
aplicación de AR emocionantes se destacan, tales como las visitas al sitio virtual, la identificación y
resolución proactiva de disputas de horario, y la comparación planificada frente a la construida. Chi et al.
[166] señaló los siguientes cuatro pilares para una adopción de AR más amplia en la industria de la
construcción. (i) Localización , la capacidad de imponer con precisión objetos virtuales en la escena de
la vida real . (ii) Una interfaz de usuario natural , que proporciona experiencias de usuario fáciles e intuitivas
para aumentar la usabilidad del software AP. (iii) Computación en la nube , que permite que
las aplicaciones almacenen y recuperen información sin interrupciones en todas partes, y (iv) dispositivos
móviles , cada vez más pequeños, económicos y potentes, y que desempeñan un papel vital en el entorno
de AR. William et al. [153] siguió adelante combinando BIM, tecnología móvil y RA. Los aspectos BIM de la
traducción geométrica, la localización en interiores, la asignación de atributos y el registro se exploran para
la integración con AR móvil. El estudio propone BIM2MAR, que proporciona guía general - líneas para la
integración de BIM con AR móvil. Se enfatiza La integración robusta de BIM requiere nuevos enfoques para
la conversión de geometría BIM y la localización en interiores de BIM usando coordenadas geográficas. Jiao
et al. [115] desarrolló un entorno AR basado en web3D para integrar BIM, servicios de redes sociales
comerciales (BSNS) y servicios en la nube.
AR y Big Data inevitablemente convergen. La complejidad asociada con Big Data en la construcción es
enorme, y solo puede superarse con métodos avanzados de visualización , en particular las tecnologías
de Aumento y Realidad Virtual . Esto requiere nuevas plataformas interactivas y metodologías
para visualizar conjuntos de datos relacionados con la construcción. El objetivo es comprender mejor e
interpretar las complicadas estructuras e interconexiones enterradas dentro de Big BIM Data para la
exploración y optimización del diseño. La Tabla XIV resume el progreso y las oportunidades potenciales para
AR en la industria de la construcción .
V. O PEN R ESEARCH I ESES Y F UTURE W ORK
Hay muchos problemas de investigación abiertos interesantes dentro de la industria de la construcción para
Big Data. Algunos de estos incluyen (pero no están limitados a) lo siguiente:
A. Herramienta de simulación de residuos de construcción:
La minimización de los residuos de construcción es el problema perenne de la industria de la construcción.
Estimar los desechos de la construcción con precisión, en las primeras etapas del diseño o a medida que
avanza el proyecto, es fundamental para tantas actividades emocionantes del proyecto. En particular,
la estimación de residuos es preliminar a la minimización de residuos en las primeras etapas del diseño,
donde proporciona información sobre cómo el diseño está generando desechos. Estas ideas permiten a los
diseñadores explorar más a fondo y llevar a cabo medidas correctivas de forma proactiva, para la eficiencia
de los residuos en las primeras etapas del diseño. Por lo tanto, la estimación de residuos de construcción se
ha convertido en la pregunta clave de investigación en la investigación de gestión de residuos de
construcción. Esta estimación requiere una exploración y optimización exhaustiva del diseño
desde una miríada de dimensiones. Los modelos de estimación de residuos existentes se basan en atributos
de proyecto muy limitados y estáticos, como GFA, suma de contrato de proyecto, etc. [107], [108], [167],
[168]. Sin embargo, estos atributos son incapaces de informar sobre el tamaño real de los desechos de la
construcción, por lo tanto, no pueden generar una estimación confiable de los desechos,
independientemente de la cantidad de datos que se utilicen durante el desarrollo de su modelo .
Un modelo integral de estimación de residuos que considera los atributos dinámicos de los proyectos
de deconstrucción, estandarización y coordinación de las dimensiones. la reutilización y el reciclaje, y la
adquisición, entre todos, deben desarrollarse. También se requiere que el modelo considere muchos
atributos de los materiales de construcción, lo que anuncia el desarrollo de una base de datos de materiales
integrales utilizando estándares de datos abiertos y vinculados. El modelo de estimación de residuos y la
base de datos de materiales de construcción se incluirán en una herramienta de simulación estándar y
práctica, donde las estimaciones de desecho se visualizan en elementos de diseño a través del tablero
analítico junto con las prescripciones necesarias para minimizarlo mediante materiales alternativos o
mejores estrategias de diseño. Esta herramienta presenta una aplicación rica de BDA en la minimización de
residuos de construcción para entre bastidores sus cargas de trabajo relacionadas con el almacenamiento y
el cómputo.
B. BDA habilitó la Plataforma de Datos de Construcción Vinculada:
Los esfuerzos de interoperabilidad existentes en la industria de la construcción se refieren principalmente al
intercambio de datos de construcción entre aplicaciones específicas de un dominio (arquitectónico,
estructural, MEP, simulación de energía, etc.) pertenecientes a la construcción. industria. Sin embargo,
muchos casos de uso interesantes pueden lograrse a partir de una mayor integración de datos BIM
con fuentes de datos externas tales como materiales, SIG, sensores, geodatos, etc. Esta interoperabilidad,
a una escala más amplia, permite a la industria de la construcción lograr la automatización de sus procesos
comerciales , que puede mejorar la eficiencia general de los participantes del proyecto. Los datos vinculados
junto con la Web de las tecnologías de datos se encuentran fenomenales para esta integración. Se realizan
progresos sustanciales para desarrollar diversos artefactos habilitantes para esta integración , como ifcOWL
ontology [169], [170]. Sin embargo, aún queda mucho por hacer. Con este fin, el desarrollo de un BDA
robusto Se requiere una plataforma habilitada que admita el almacenamiento y procesamiento de estos
diversos conjuntos de datos vinculados pertenecientes al edificio , así como a otros datos. Esta plataforma
puede proporcionar la base para el desarrollo de aplicaciones interesantes, particularmente para
análisis de energía y edificios inteligentes.
C. Sistema BIM impulsado por Big Data para el progreso de la construcción Supervisión:
Actualmente, BIM prevalece en el mundo del diseño, con una utilización muy limitada en todas las etapas de
construcción y FM del edificio. La intención real de BIM nunca podría lograrse hasta que se emplee en todas
las etapas del ciclo de vida del edificio. En la actualidad, ningún mecanismo de este tipo puede facilitar el
seguimiento del progreso de varios sitios de construcción utilizando herramientas automatizadas. De hecho,
es muy laborioso y poco práctico (hasta cierto punto) actualizar el modelo BIM con detalles tan minuciosos
relacionados con el progreso diario de la construcción. Como resultado, en tiempo real El monitoreo del
progreso de la construcción no es una tarea fácil, ya que se requiere que los gerentes visiten sus sitios
regularmente y evalúen el progreso subjetivamente con el calendario previsto, que es menos efectivo y
propenso a errores. El empleo de Big Data y tecnologías de detección podría llevar el estado del arte en el
dominio de la supervisión del progreso de la construcción al siguiente nivel. Usando la última tecnología de
imágenes, el progreso de la construcción en curso se captura en tiempo real . Big Data Analytics procesará
las transmisiones en tiempo real de estas imágenes para medir el cambio diario y actualizará los modelos
BIM y el calendario de construcción en consecuencia. Los gerentes de proyecto reciben una actualización al
progreso de la fecha en el cronograma, que , a su vez, les permite ver si están rezagados en el proyecto o
aún siguen el cronograma. En consecuencia, los administradores del proyecto pueden responder
proactivamente en caso de que se notifique cualquier retraso. Esto les ahorrará mucho dinero debido a la
penalidad cada vez que se pierda el plazo , y mejorará el control y la supervisión general del proyecto. Esto
también está alineado con la visión de la adopción de BIM. De esta forma, Big Data puede ayudar a la
industria a entregar los proyectos a tiempo.
D. Big Data para Diseño con Datos:
Actualmente, los diseños se producen únicamente en función de los requisitos del cliente y la experiencia de
los diseñadores. Por lo tanto, los diseños que se adaptan a las necesidades más amplias de los usuarios, así
como el entorno que los rodea, son raros. Por ejemplo, los diseñadores rara vez consideran los datos
recopilados por los fabricantes en cientos o miles de sus líneas de productos durante la especificación del
diseño, lo que podría ser bastante valioso. Del mismo modo, muchas otras fuentes de datos pueden
ser relevante para diseños tales como los sentimientos de los usuarios mientras interactúan con las
instalaciones, el clima, las inundaciones, el consumo de energía, el patrón de viaje en esa vecindad y las
densidades de la población, para nombrar unos pocos. Estos conjuntos de datos podrían aprovecharse para
respaldar, por ejemplo, la generación de un cronograma de construcción óptimo. Y lo bueno es que estos
datos se capturan utilizando tecnologías como la web , sensores, medidores inteligentes, teléfonos móviles,
etc., y están disponibles a través de la iniciativa de datos abiertos (en la mayoría de los casos). Sin embargo,
el mundo del diseño todavía está desapegado de aprovechar estas fuentes de datos para su propósito.
Actualmente, no existe una herramienta que pueda facilitar a los diseñadores aprovechar estos
datos durante sus actividades de diseño. Si esto se logra, esto puede dar como resultado el cambio de
paradigma de Design with Data, donde estas diversas fuentes de datos se integran dentro de las
herramientas de autoría de BIM y se ponen a disposición de arquitectos, ingenieros, contratistas y gerentes
de instalaciones en las primeras etapas de diseño. Big Data Analytics es de hecho la clave de esta frontera de
la innovación. Esta integración simbiótica de diversas fuentes de datos con BIM finalmente conducirá a la
generación de diseños de próxima generación que pueden cumplir con los requisitos más amplios de la
sostenibilidad, los usuarios, el medio ambiente e incluso las infraestructuras más amplias del concepto
emergente de ciudades inteligentes.
VI. P ITFALLS OF B IG D ATA EN C ONSTRUCTION I NDUSTRY
A pesar de las oportunidades y los beneficios acumulables de Big Data en esta industria, algunos temas
desafiantes siguen siendo motivo de preocupación . En esta sección se analizan algunos de estos desafíos y
se brindan sugerencias para abordarlos con el fin de implementar y difundir con éxito las tecnologías de Big
Data en diversas aplicaciones de dominio de la industria de la construcción.
A. Seguridad de datos, privacidad y protección :
Destaca entre estas preocupaciones el problema de la seguridad de los datos, la propiedad de los datos y los
problemas de gestión. Para escalar los obstáculos planteados por estos desafíos, varios estudios de
investigación han propuesto e implementado medidas de seguridad tales como control de acceso,
prevención de intrusos, prevención de denegación de servicio (DoS) , etc. [171], [172], [173]. Estos
problemas también requieren más estudio en el contexto de los datos de construcción relacionados con
BIM, y las soluciones apropiadas también deben adoptarse en los flujos de trabajo analíticos subyacentes.
B. Calidad de datos de conjuntos de datos de la industria de la construcción:
La industria de la construcción es bien conocida por las prácticas fragmentadas de gestión de datos . A pesar
de la agresiva promoción de BIM, las compañías que usan BIM son raras . Valores nulos, valores
engañosos, valores atípicos, valores no estandarizados, entre otros, son algunos de los rasgos esenciales de
los datos de la industria. Y la producción de análisis de alto valor es un reto debido a las malas prácticas de
gestión de datos. Los datos de alta calidad son preliminares para proyectos exitosos de Big Data. Se observa
que los proyectos de análisis generalmente requieren aproximadamente el 80% del tiempo para limpiar los
conjuntos de datos ruidosos antes de embarcarse en los análisis. Entonces, los proyectos de Big Data en La
industria de la construcción también debe ser especialmente atendida, por cuestiones relacionadas con la
calidad de los datos. De lo contrario, es probable que las ideas resultantes induzcan a error, lo que a su vez
dará lugar a una sensación desagradable y pesimista en la industria. En consecuencia, la industria será reacia
a adoptar tendencias tan fascinantes como Big Data.
C. Implicaciones de costo para Big Data en la industria de la construcción:
Cada tecnología implica un costo por lo que la introducción de Big Data en la construcción no es gratuita . Se
requiere que las empresas establezcan centros de datos y adquieran licencias de software, lo que puede
ser una inversión atractiva . Además, el personal de TI capacitado para mantener todo el ecosistema
en funcionamiento es otro gasto general. Entonces, Big Data tiene una implicación de costo inevitablemente
sustancial. los el negocio de la construcción se considera entre las empresas de bajo margen de ganancia, y
la introducción de tales costosos complementos a los proyectos es más probable que se opongan y sea difícil
de ser
defendido Sin embargo, Big Data tiene el potencial de mejorar la entrega general del proyecto optimizando
los procesos y reduciendo los riesgos que las empresas generalmente soportan debido a innumerables
ineficiencias tales como demoras, litigios, etc. Es muy optimista que la industria de la construcción pueda
obtener enormes ganancias de esta inversión como experimentado por otras industrias, siempre que se use
la metodología correcta para emplear Big Data. Sin embargo, la implicación de costos exacta de Big
Data es difícil de cuantificar. Se requieren más estudios sobre el análisis de costo-beneficio del uso de
tecnologías Big Data en proyectos de construcción.
D. Conectividad a Internet para aplicaciones de Big Data:
Para supervisar las actividades del sitio del proyecto en tiempo real , se debe admitir la transmisión de datos
instantánea entre los sitios del proyecto (presas, carreteras, etc.) y el repositorio centralizado de Big
Data. Sin embargo, los sitios del proyecto generalmente tienen un ancho de banda bajo; debido a la falta de
infraestructura de red sofisticada en áreas rurales subdesarrolladas. Las redes de sensores inalámbricos
avanzados deben ampliarse para abordar los problemas de conectividad a Internet en este tipo
de aplicaciones de Big Data ; de lo contrario, las decisiones sobre datos fuera de línea obsoletos no
serán útiles para una supervisión efectiva .
E. Explotando Big Data en todo su potencial:
La efectividad de Big Data no puede medirse simplemente acumulando grandes volúmenes de datos; que es
más de los casos de uso o problemas industriales que dictan la utilidad de estas tecnologías. Se teme que la
industria de la construcción no pueda extraer todo el valor de Big BIM Data accesible si los casos de uso
concebidos son vagos. Para este fin, se requiere que los investigadores o expertos de dominio resalten los
problemas específicos del dominio que son el tema de Big Data. De esta forma, Big Data como tecnología no
será la fuerza motriz, sino que la industria misma liderará la innovación mediante la aplicación de
herramientas contemporáneas para resolver sus problemas actuales. Además, Big Data no es la plata bullet,
simplemente establece el escenario. Expertos calificados y expertos en el dominio, dotados
de sofisticados flujos de trabajo analíticos, son igualmente necesarios para cosechar los beneficios
generales. Sin ellos, es probable que las aplicaciones caigan en la trampa de producir demasiada información
que no debería proporcionar información significativa para el propósito.
II. C ONCLUSIONES
Aunque la industria de la construcción genera cantidades masivas de datos a lo largo de todo el ciclo de vida
de un edificio, la adopción de la tecnología Big Data en este sector va a la zaga del progreso logrado en otros
campos. Con la comoditización de la tecnología necesaria para almacenar, computar, procesar, analizar
y visualizar Big Data, existe un inmenso interés en aprovechar tales tecnologías para mejorar la eficiencia de
los procesos de construcción. En este estudio exploratorio, hemos analizado hasta qué punto la industria ha
empleado las tecnologías Big Data. Con este fin, hemos revisado no solo las últimas investigaciones, sino
también los artículos de investigación relevantes que se han publicado en las últimas décadas en los que se
han implementado las técnicas modernas de Big Data Analytics en diversas aplicaciones de construcción
específicas de dominios. Los principales flujos de tecnología de Big Data se explican para ayudar a los
lectores a comprender el tema complicado . Los conceptos de Big Data Engineering y Big Data Analytics
están demarcados; el Las obras que utilizan estas tecnologías en varios subdominios de la industria de la
construcción son deliberadas.
A través de nuestra investigación, concluimos que si bien los análisis basados en datos se han usado durante
mucho tiempo en la industria de la construcción debido a la amplia aplicabilidad de tales técnicas
en muchos subdominios de construcción, la adopción de la tecnología Big Data , mucho más ágil y poderosa,
ha sido relativamente reciente. lento. Aunque la tendencia de Big Data se está extendiendo gradualmente
en la industria; su aplicabilidad se amplifica aún más por muchas otras tendencias emergentes como BIM,
IOT, computación en la nube, edificios inteligentes y realidad aumentada , que también están ligeramente
elaboradas. Nosotros
presentó algunos de los trabajos futuros destacados junto con las posibles dificultades asociadas con Big
Data mientras lo adopta en la industria. Hasta donde tenemos conocimiento, esta es la primera revisión en
profundidad de las aplicaciones de las técnicas relacionadas con Big Data en la industria de la
construcción. En nuestro trabajo, hemos identificado muchas áreas de aplicación potenciales en las cuales
las técnicas de Big Data pueden avanzar significativamente en el estado del arte en la industria
de la construcción. Este trabajo es de utilidad y relevancia para todos los investigadores y profesionales de la
construcción que quieran aprovechar el poder de Big Data en la industria de la construcción.
para desarrollar aplicaciones comerciales emocionantes .

Automated Hardhat Detection For Construction Safety Applications

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Automated Hardhat Detection For Construction Safety Applications

Transféré par

Droits d'auteur :

Formats disponibles

Big Data en la industria de la construcción:

una revisión del estado actual , las

próxima frontera de la innovación en la industria.

A. Procesamiento de Big Data

B. Big Data Storage

III. B IG D ATA A NALYTICS

2) Minería de datos : la minería de datos se ocupa de la exploración y el análisis automáticos o

valreg = new L ogisti cRe gression () . se tMa x I ter (1 5)

Listado 1. Una instantánea del código MLlib para análisis de regresión

valsplits = analizar dDa t a. rand omSp lit (Ar r ay (0. 6, 0. 4) ,

9 valscor eAn dLa bels = tes t. mapa f punto = > 71

D. Procesamiento del lenguaje natural (NLP)

E. Recuperación de información (IR)

VI. P ITFALLS OF B IG D ATA EN C ONSTRUCTION I NDUSTRY

Vous aimerez peut-être aussi