<div dir="auto"><div><div class="gmail_quote"><div dir="ltr">On Mon, Sep 24, 2018, 14:03 Kees Bakker <<a href="mailto:keesb@ghs.com">keesb@ghs.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Same question again: what is the best approach to recover<br>
from a container in an ERROR state?<br></blockquote></div></div><div dir="auto"><br></div><div dir="auto">Please show me the dmesg output. If it is a kernel bug you're hitting there's nothing that LXD can do to help you.</div><div dir="auto"><br></div><div dir="auto"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
This time it happened with Ubuntu 18.04 and LVM storage.<br>
<br>
The steps leading to this were as follows. It's just an FYI, I don't think it<br>
really matters, except for the stop and start.<br>
<br>
  lvextend -L 20G local/containers_xyz<br>
  resize2fs /dev/local/containers_xyz<br>
  lxc stop xyz<br>
  e2fsck -f /dev/local/containers_<br>
  lxc start xyz<br>
<br>
... the start command hanged.<br>
<br>
Some output os ps auxfwww<br>
<br>
root      6224  0.0  0.0  22912  4096 pts/1    S    sep06   0:00  |               \_ -bash<br>
root     20900  0.0  0.0 1136140 12092 pts/1   Sl+  12:19   0:00  |                   \_ lxc start xyz<br>
--<br>
root     18157  3.5  4.2 5581444 1398904 ?     Ssl  sep12 611:36 /usr/lib/lxd/lxd --group lxd --logfile=/var/log/lxd/lxd.log<br>
root     20918  0.0  0.0 521720 19780 ?        Sl   12:19   0:00  \_ /usr/lib/lxd/lxd forkstart xyz /var/lib/lxd/containers /var/log/lxd/xyz/lxc.conf<br>
root     20925  0.0  0.0      0     0 ?        Z    12:19   0:00      \_ [lxd] <defunct><br>
--<br>
root     20926  0.0  0.0 530432  7280 ?        Ss   12:19   0:00 [lxc monitor] /var/lib/lxd/containers xyz<br>
root     20943  0.0  0.0 530432  3484 ?        D    12:19   0:00  \_ [lxc monitor] /var/lib/lxd/containers xyz<br>
<br>
<br>
<br>
On 11-09-18 15:13, Kees Bakker wrote:<br>
> Hey,<br>
><br>
> Every now and then we have one or more containers in state ERROR.<br>
> Is there a clever method to recover from that, other than<br>
> rebooting the LXD server?<br>
><br>
> Killing the monitor and the forkstart does help. And also a kworker<br>
> process (kworker/u16:0) is eating up one of the CPUs with 100% load.<br>
> lxc info gives "error: Monitor is hung"<br>
><br>
> I'm running Ubuntu 16.04 with BTRFS. The kernel is 4.15.0-33-generic<br>
<br>
_______________________________________________<br>
lxc-users mailing list<br>
<a href="mailto:lxc-users@lists.linuxcontainers.org" target="_blank" rel="noreferrer">lxc-users@lists.linuxcontainers.org</a><br>
<a href="http://lists.linuxcontainers.org/listinfo/lxc-users" rel="noreferrer noreferrer" target="_blank">http://lists.linuxcontainers.org/listinfo/lxc-users</a></blockquote></div></div></div>