Microsoft

Cómo encontrar duplicados usando Microsoft Power Query

Microsoft Power Query requiere menos experiencia al intentar encontrar registros duplicados en una hoja de cálculo de Microsoft Excel.

Microsoft Office 365Imagen: dennizn/Adobe Stock

Hay varias formas de encontrar duplicados en una hoja de cálculo de Microsoft Excel. Puede usar funciones, formato condicional, filtrado y más. Microsoft Excel incluso ofrece una función integrada que encuentra y elimina duplicados por usted. Si está trabajando con grandes cantidades de datos o importando datos a Power BI, es posible que desee considerar usar Power Query para representar duplicados en lugar de eliminarlos.

En este tutorial, le mostraré cómo usar Microsoft Power Query para encontrar datos duplicados en Excel. El beneficio es que el proceso no requiere conocimientos especiales de funciones o formato condicional. Puede descargar una demostración de este tutorial de Power Query.

VER: Comparación de funciones: software y sistemas de seguimiento de tiempo (Tecnopedia Premium)

Uso Microsoft 365 en Windows 10 de 64 bits, pero puede usar versiones anteriores con Excel 2010.

Cómo conectarse a Power Query

El primer paso para usar Power Query con datos de Excel es hacer una conexión entre los dos, que es simple; sin embargo, Power Query requiere que formatee sus datos como un objeto de tabla. No tiene que preocuparse, porque cuando inicie el proceso, Excel le pedirá que convierta el rango de datos en una tabla si es necesario.

A continuación, identifique los datos de Excel que contienen registros duplicados, como Figura Ahaciendo lo siguiente:

  1. Haga clic en cualquier lugar dentro de la tabla o rango de datos y luego haga clic en la pestaña Datos. Si se le solicita que cree la tabla, haga clic en Aceptar.
  2. En el grupo Obtener y transformar datos, haga clic en Desde tabla/rango.

Figura A

PQDuplicates AIdentificar datos de Excel.

Eso es todo.como puedes ver Figura Blos datos ahora están en Power Query.

Figura B

PQDuplicates BCargue datos en Power Query.

Con datos en Power Query, es hora de encontrar duplicados. Hay dos filas duplicadas que puede encontrar fácilmente ordenando, pero no tiene que ordenar cuando usa Power Query.

Cómo marcar duplicados en Power Query

No queremos eliminar los duplicados. En cambio, queremos etiquetarlos de alguna manera. Agregaremos una nueva columna que identifique los duplicados de alguna manera. El proceso es más simple de lo que piensas.

Primero, necesitamos agregar una columna de índice, que tendrá más sentido más adelante. Ahora haz lo siguiente:

  1. Haga clic en la pestaña Agregar columna.
  2. En la lista desplegable Columna de índice en el grupo General, seleccione Desde cero.

Figura C

PQDuplicates CAgregar columna de índice.

como puedes ver Figura CPower Query agrega una columna de índice, una columna de valores consecutivos que comienzan con 0.

Cobertura de Windows de lectura obligada

Antes de que podamos identificar la repetición, debemos determinar qué constituye una repetición. Usaremos grupos avanzados basados ​​en las columnas Fecha, Valor y Personal. Las otras dos columnas son irrelevantes. Estadísticamente, no es imposible, pero sí poco probable, que el mismo empleado realice dos ventas del mismo valor el mismo día. En nuestro conjunto de datos simple, esto es lo mejor que podemos hacer, ya que no hay una columna que identifique de manera única cada registro, como el número de factura.

Primero, necesitamos crear este grupo:

  1. Seleccione las filas de Fecha, Valor y Persona manteniendo presionada la tecla Mayús mientras hace clic en cada encabezado.
  2. Haga clic en la pestaña Transformar y luego haga clic en Agrupar por en el grupo Tablas. En el cuadro de diálogo resultante, Power Query completa las primeras tres listas desplegables con los nombres de las columnas seleccionadas.
  3. Nombre la columna Buscar duplicados y seleccione Contar filas en la lista desplegable Operación.
  4. Haga clic en Agregar agregación.
  5. Nombre la columna Buscar duplicados 2 y seleccione Todas las filas (Figura D).
  6. Haga clic en Aceptar.

Figura D

PQDuplicates DConfigure grupos en función de la fecha, el valor y la dotación de personal.

Figura E

PQDuplicates EPower Query muestra un conjunto único de registros.

como puedes ver Figura E, la columna Buscar duplicados devolverá un valor de 2 si el registro tiene duplicados. La columna Buscar duplicados 2 devuelve el glosario, del que nos ocuparemos más adelante. Esta consulta no muestra registros duplicados.

Actualmente, la tabla solo devuelve registros únicos, que no es lo que queremos. Queremos mantener todos los registros, es una tarea simple:

  1. Haga clic en el botón de expansión de la columna Buscar duplicados 2.
  2. Desmarque las columnas que componen el grupo: Fecha, Valor y Persona.
  3. Si es necesario, desmarque la opción Usar nombres de columnas originales como prefijo (Figura F).
  4. Haga clic en Aceptar.

Figura F

PQDuplicates FExpanda la columna Buscar duplicados 2 para ver todos los registros.

Figura G

PQDuplicates GPower Query muestra todos los registros.

Ahora puede ver todos los registros, como se muestra en la figura Figura GActualmente, Power Query identifica duplicados con un valor de 2 en la columna Buscar duplicados y muestra todos los duplicados. Sin embargo, si se desplaza hacia la derecha, puede ver que la columna Índice está desordenada. Aparentemente, Power Query ordena los registros.

Anteriormente, mencioné que agregar esta columna tendría sentido más adelante. Esta columna le permite mantener el orden original si es necesario. La columna de índice está disponible simplemente haciendo clic en la lista desplegable de la columna de índice y seleccionando Ordenar de forma ascendente. Puede soltar la columna de índice, pero yo la mantendría.

Después de identificar los duplicados y mostrar todos los registros, puede cargar los datos en Excel.

Cómo cargar datos en Excel

Cargar datos en Excel es un paso rápido y fácil. En la pestaña Inicio, haga clic en Apagar y cargar en el grupo Apagar. Luego haga clic en Cerrar y cargar en el menú desplegable Resultados. Power Query crea una nueva hoja basada en el nombre de la tabla, en este caso TableSales como se muestra a continuación Figura H.

Figura H

PQDuplicates HCargue los datos en Excel.

Una vez que los datos están nuevamente en Excel, puede usarlos como cualquier otro dato en Excel. Es posible que desee agregar un formato condicional para resaltar los duplicados en función de los valores 1 y 2 de Buscar duplicados. El proceso de marcar duplicados es simple y le brinda la flexibilidad de mostrarlos o no en Excel.

LEER  Combinando Windows 8 y Retina MacBook

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba