臺北醫學大學

R語言大量xml處理

2019年8月20日 21:24
不好意思前一篇文按到刪除了... 謝謝那個回覆我的輔大同學!
我想將大量xml合併為一個df Row=file name Col=nodes 單一個xml已經確定可以做到了 但是試著用for去跑就會error 想請教一下是哪裡不對...剛接觸R 也不是本科系的 有點沒頭緒... 或是有其他更好的作法希望能提點我 我會去找的QQ 現在也還在努力爬stackoverflow
2
回應 4
文章資訊
共 4 則留言
健行科技大學
えと~ 雖然我沒有寫過R 不過好像沒人回妳.. 軟體工程師那也PO一篇我有看到.. 不過你的merge不用指定嗎? xmldf <- merge(xmldf,xmldf2) 然後你的第一次 i = 0裡面 不用做一個continue嗎? R 應該叫做 next 我不太建議在裡面做i = 0滿混亂的 不如放到外面 files 拋出出第一位做處理 doc = files.pop(0) xmldf = ... loop{ ... } 最後error問題我只能猜想是資料面的問題 我是不知道如果doc拋出來是空的 或著 不同型態可不可以merge 所以我都會+log
原 PO - 臺北醫學大學
B1 確實還是error在跳出空的merge_df... 想請問一下您說的doc拋出來是空的 是什麼意思? 因為不多個檔案合併的話 單一個xml我用相同作法是有one row的df的 謝謝你回覆我😭
健行科技大學
簡單來說 Xmlparse解析完 如果內容是empty then add continue, doc=... next 也許marge如果進行空的合併會出錯 我猜啦 所以我都會print parse的資料 就是你的doc 有沒有完整的error message? 可能會比較好判斷
原 PO - 臺北醫學大學
B3 你好 我print出來的doc都沒有問題 就是合併後會空 後來檢查出來是格式不符df不能直接合併 改用list就沒這個問題了 謝謝你的幫忙!