您好,登錄后才能下訂單哦!
這篇文章主要介紹了數據庫根據指定字段去重的案例分析,具有一定借鑒價值,需要的朋友可以參考下。希望大家閱讀完這篇文章后大有收獲。下面讓小編帶著大家一起了解一下。
需求:對一張用戶表根據name/email/card_num字段去除重復數據;
思路:用group by方法可以查詢出'去重'后的數據,將這些數據存儲到一張臨時表中,然后將臨時表的數據存儲到指定的表中;
誤區及解決方案:group by方法只能獲取部分字段(去重指定字段),不能一次獲取到完整的數據,但是可以通過max函數獲取group by結果集中的id,再根據id集合查詢出全部的記錄。
SELECT max(id) as id,name,email,card_num FROM users GROUP BY name,email,card_num;
SELECT ID from (SELECT max(id) as id,name,email,card_num FROM users GROUP BY name,email,card_num) as T;
SELECT * from users where id in (SELECT ID from (SELECT max(id) as id,name,email,card_num FROM users GROUP BY name,email,card_num) as T);
create TEMP TABLE tmp_data as SELECT * from users where id in (SELECT ID from (SELECT max(id) as id,name,email,card_num FROM users GROUP BY name,email,card_num) as T);
insert into users_copy1 select * from tmp_data;
select count(*) from users_copy1;
測試結果:1.4w條數據中有2300條數據重復,實際運行結果為0.7s,基本滿足現在的需求。
感謝你能夠認真閱讀完這篇文章,希望小編分享數據庫根據指定字段去重的案例分析內容對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,遇到問題就找億速云,詳細的解決方法等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。